© bundesrepublik ® Of f enlegu ngsschrif t 

D E UTS CH LAND ^Qg ^g^gSI At 




DEUTSCHES 
PATENTAMT 



© Int. CI. 6 : 

G 06 F 9/06 

G06F 15/76 



© Aktenzeichen: 
© Anmeldetag: 
© Offenlegungstag: 



19614991.6 
16. 4.96 
24. 10. 96 



© Unionsprioritat: @ © © 


@ Erfinder: 


17.04.95 US 423560 


Baxter, Michael A., Menlo Park, Calif., US 


© Anmelder: 




Ricoh Co., Ltd., Tokio/Tokyo, JP 




© Vertreter 




Schwabe, Sandmair, Marx, 81677 Munchen 





CO 

a> 



UJ 

Q 



Prufungsantrag gem. § 44 PatG ist gestellt 

© System und Verfahren zum skalierbaren, parallelen, dynamisch rekonfigurierbaren Rechnen 

© Die Erfindung betrifft em System und ein Verfahren zum 
skalierbaren, parallelen, dynamisch rekonfigurierbaren 
Rechnen. Ein Satz von S-Maschinen, eine T-Maschine, die 
zu jeder S-Maschine korrespondierend ist, eine Allzweck- 
Verbindungsmatrix (GPIM), ein Satz von l/O-T-Maschinen, 
ein Satz von l/O-Vorrichtungen und eine Master-Zertbasis- 
einheit bitden ein System fur skalierbares paradeles, dyna- 
misch rekonfigurierbaros Rechnen. Jede S-Maschine ist ein 
dynamisch rekonfigurierbarer Rechner mit einem Speicher, 
einer ersten lokalen Zeitbasiseinheit und einer dynamisch 
rekonfigurierbaren Verarbeitungseinheit (DRPU). Die DRPU 
wird reaiisiert bzw. implementiert, indem eine reprogram- 
mierbare Logikvorrichtung verwendet wird, die als eine 
Instruktionsabrufeinheit (IFU), eine Datenoperationseinheit 
(DOU) und eine Adressenoperationseinheit (AOU) konfigu- 
riert ist, von denen jede selektiv wan rend einer Programm- 
ausfuhrung in Antwort auf einen Rekonfigurationsinterrupt 
oder der Auswahl einer Rekonfigurationsanweisung, die in 
einen Satz von Programminstruktionen eingebettet ist, re- 
konfiguriert wird. Jeder Rekonfigurationsinterrupt und jede 
Rekonfigurationsanweisung nimmt auf einen Satz von Konfi- 
gurationsdaten Bezug, der eine DRPU-Hardware-Organisa- 
tion speziftziert, die fur Realisierung bzw. Implementation 
einer bestlmmten Instruktionssatzarchrtektur (ISA) optimiert 
ist Die IFU verwaltet Rekonfigurationsoperationen, Instruk- 
tionsabruf- und Decodieroperationen, Speicherzugriffsope- 
rationen, ... 
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Beschreibung 

Die vorliegende Erfindung nimmt bezug auf die US-Patentanmeldung mit dem Titel: "System und Verfahren 
fQr phasensynchrones Takten mit flexibler Frequenz und phasensynchrone NachrichtenUbertragung" bzw. "Sy- 
stem and Method for Phase-Synchronous, Flexible Frequency Clocking and Messaging". 

Die vorliegende Erfindung betrifft im allgemeinen die Architektur von Computern und insbesondere Systeme 
und Verfahren ziim rekonfigurierbaren bzw. umstrukturierbaren Rechnen. Noch genauer handelt es sich bei der 
vorliegenden Erfindung urn ein System und ein Verfahren zum skalierbaren, parallelen, dynamisch rekonfigu- 
rierbaren Rechnen. 

Die Evolution der Compute rarchitektur wird von dem BedQrfnis nach imrner grdBerer Rechenleistung ange- 
trieben. Eine schnelle und genaue Ldsung verschiedener Arten von Rechenprobiemen oder numerischen Proble- 
men erfordert typischerweise verschiedene Arten von Rechen-Systemelementen bzw. Rechen-Resourcen. 1st 
ein bestimmter Problembereich gegeben, so kann die Rechenleistung durch die Verwendung von Rechen-Sy- 
stemelementen erhdht werden, die speziell fttr die betrachteten Prpblemtypen architektonisch ausgelegt bzw. 
strukturiert wurden- Zum Beispiel kann die Verwendung einer Hardware zur digitalen Signalverarbeitung (DSP) 
bzw. eine "Digital Signal Processing"- Hardware in Verbindung mit einem Allzweck-Computer signifikant be- 
stimmte Arten der Signalverarbeitungsleitung bzw. der Signalverarbeitungswirkung erhohea FQr den Fall, daB 
ein Computer selbst speziell fur die betrachteten Problemtypen architektonisch ausgelegt wurde, wird die 
Berechnungsleistungsfahigkeit weiter erhdht werden oder mdglicherweise sogar in bezug auf die verfugbaren 
Rechen-Systemelemente bzw. Rechen-Resourcen fur diese bestimmten Problemtypen optimiert werden. Ge- 
genwartige parallele oder massiv parallele Computer, die eine hohe Leistungs&higkeit fur bestimmte Typen von 
Probleme der Ordnung n 2 bzw. von 0(n 2 ) oder grdBerer Komplexitat anbieten, stellen Beispiele fur diesen Fall 
dar. 

Das BedQrfnis nach grdBerer Rechenleistung muB gegenQber dem Bedurfnis nach der Minimierung der 
Systemkosten und dem Bedurfnis nach der Maximierung der Systemleistungsfahigkeit in einem breitestmogli- 
chen Bereich sowohl der taglichen bzw. aktuellen als auch moglichen zukunftigen Anwendungen abgewogen 
werden. Im allgemeinen beeintrachtigt das Einbringen von Rechen-Systemelementen bzw. Rechen-Resourcen, 
die auf eine begrenzte Anzahl von Problemtypen ausgerichtet sind, in ein Computersystem nachteilig die 
Systemkosten, weil eine spezialisierte Hardware typischerweise teurer ist als: eine Allzweck-Hardware. Die 
Gestaltung und die Erzeugung eines ganzen Computers fur einen bestimmten Zweck kann so teuer werden, daB 
es sich verbietet, und zwar sowohl bezuglich der ErsteUungszeit als auch der Hardwarekosten. Die Verwendung 
spezialisierter Hardware, urn die Rechenleistung zu erhdhen, kann wenig positives bezuglich der Leistungsf ahig- 
keit anbieten, da die Bedurfnisse bezuglich der Berechnungen sich andern. Im Stand der Technik wurden, da sich 
die Erfordernisse bezuglich der Berechnung geandert haben, neue Typen spezialisierter Hardware oder neue 
Systeme fur bestimmte Zwecke gestaltet und hergestellt, was zu einem weiterlaufenden Kreislauf von uner- 
wunschten, nicht zurucklaufenden Ingenieurkosten bzw. ErsteDungskosten fuhrt Die Verwendung von Rechen- 
Systemelementen bzw. Rechen-Resourcen, die auf bestimmte Problemtypen ausgerichtet sind, fuhrt deshalb zu 
einer inef fizenten Verwendung verfugbaren System-Siliziums, wenn man die sich andernden Rechenerfordernis- 
se bzw. Rechenbedurfnisse in Betracht zieht Somit ist es wegen der oben beschriebenen GrOnde nicht wUn- 
schenswert, wenn man versucht, die Rechenleistung zu erhdhen, indem man spezialisierte Hardware verwendet 

Im Stand der Technik wurden verschiedene Versuche bzw. Anlaufe unternommen, urn sowohl die Rechenlei- 
stung zu erhdhen als auch die probiemtypische Anwendbarkeit zu maximieren, indem reprogrammierbare oder 
rekonfigurierbare Hardware verwendet wird Ein erster derartiger Anlauf bzw. Versuch gemaB dem Stand der 
Technik liegt in herunterladbaren Mikrocode-Computerarchitekturen. In einer herunterladbaren Mikrocode- 
Architektur kann das Verhalten von fixen, nicht rekonfigurierbaren Hardware-Systemelementen selektiv gean- 
dert werden, indem eine bestimmte Version eines Mikrocodes verwendet wird. 

Ein Beispiel fur eine derartige Architektur ist diejenige des IBM-Systems/360. Da die fundamentale bzw. 
grundlegende Rechen-Hardware in derartigen Systemen nach dem Stand der Technik nicht selbst rekonf igurier- 
bar ist, liefern derartige Systeme keine optimierte Rechenleistungsfahigkeit, wenn man einen breiten Bereich 
von Problemtypen betrachtet 

Ein zweiter Anlauf bzw. Versuch nach dem Stand der Technik im Hinblick auf sowohl einer Erhdhung der 
Rechenleistungsfahigkeit als auch einer Maximierung der problemtypischen Anwendbarkeit liegt in der Ver- 
wendung einer rekonfigurierbaren Hardware, die mit einem nicht-rekonfigurierbaren Host-Prozessor oder 
Most-System verbunden ist bzw. damit gekoppelt ist. Diesen Versuch bzw. Anlauf kann man als "zugeordnete 
rekonfigurierbare Prozessor" — bzw. "Attached Reconfiguralbe Processor" (ARP) -Architektur kategorisieren, 
bei welcher ein gewisser Anteil der Hardware innerhalb einer Prozessorgruppe, die einem Most zugeordnet ist, 
rekonfigurierbar ist Beispiele gegenwartiger ARP-Systeme, die eine Gruppe rekonfigurierbarer Prozessoren 
verwenden, die mit einem Most-System gekoppelt sind bzw. verbunden sind, beinhalten: die SPLASH- 1- und 
SPLASH-2-Systeme, die an dem Supercomputer Forschungszentrum bzw. Supercomputing Research Center 
(Bowie, MD, USA) designed bzw. gestaltet wurden; den WILDFIRE bzw. allgemein konfigurierbaren Computer, 
der von den Annapolis Micro Systems (Annapolis, MD, USA) hergestellt wird, der eine kommerzielle Version 
der SPLASH-2 darstellt; und dem EVC-1, der von der Virtual Computer Corporation (Reseda, CA, USA), 
hergestellt wird Bei den meisten rechenintensiven Problemen wird eine betrachtliche Menge an Zeit darauf 
verwendet, relativ kleine Abschnitte von Programmcodes auszufuhren. Im allgemeinen werden ARP-Architek- 
turen verwendet, urn eine rekonfigurierbare Rechenbeschleunigungseinrichtung fur derartige Abschnitte von 
Programmcodes bereitzustellen. Unglucklicherweise leidet ein Rechenmodell, das auf einer oder mehreren 
rekonfigurierbaren Rechenbeschleunigungseinrichtungen basiert, an betrachdichen Nachteilen, wie im folgen- 
den beschrieben werden wird. 
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Ein erster Nachteil der ARP-Architekturen tritt auf, weil ARP-Systeme versuchen, eine optimierte Implemen- 
tation eines bestimmten Algorithmus in einer rekonfignrierbaren Hardware zu einer bestimmten Zeit bereitzu- 
steilen. Die Philosophic die hinter dem EVC-1 der Virtual Computer Corporation liegt, besteht z. B. darin, emen 
speziellen Algorithmus in eine spezielle {Configuration von rekonfigurierbaren Hardware-Systemelementen 
umzuwandeln, um eine optimierte Rechenletstung fur jenen bestimmten Algorithmus bereitzustellea 

Rekonfigurierbare Hardware-Systemelemente werden allein zu dem Zweck verwendet, eine optimale Lei- 
stungsfahigkeit fOr einen bestimmten Algorithmus bereitzustellen. Die Verwendung von rekonfigurierbaren 
Hardware-Systemelementen fOr allgeraeinere Zwecke, wie z. B. dem Management der Ausfuhrung von Instruk- 
tionen bzw. Befehlen, wird vermieden. Fur einen gegebenen AJgorithmus werden somit rekoniigurierbare 
Hardware-Systemelemente unter dem Gesichtspunkt von individuellen Gattern bzw. Gates betrachtet, die 
gekoppelt sind, um eine optimale Leistungsf ahigkeit zu gewahrleistea 

Gewisse ARP-Systeme verlassen sich auf ein ProgrammierungsmodeU, bei welchem ein "Programm* sowohl 
konyentionelle Programminstruktionen bzw. -befehle beinhaltet als auch Instruktionen fGr spezielle Zwecke, die 
spezifizieren, wie verschiedene rekonfigurierbare Hardware-Systemelemente untereinander verbunden sind 
Weil ARP-Systeme rekonfigurierbare Hardware-Systemelemente in einer algorithmus-spezifischen Art und 
Weise auf Gatterebene betrachten, mttssen diese auf einen speziellen Zweck gerichtete Instruktionen explizite 
Details bezflglich der Natur eines jeden verwendeten rekonfigurierbaren Hardware-Systemelements und der 
Art und Weise, in der es mit anderen rekonfigurierbaren Hardware-Systemelementen verbunden ist, bereitstel- 
len. Dies beeinfluBt nachteUig die Prograramkomplexitat Um die Programmkomplexitat zu verringem, wurden 
Versuche unternommen, eine Programmiermodell zu verwenden, bei welchem ein Programm sowohl konventio- 
nelle Instruktionen auf hohem Niveau einer Programmiersprache als auch Instruktionen auf hohem Niveau fQr 
spezielle Zwecke beinhaltet Gegenwartige ARP-Systeme versuchen deshalb, ein Kompilier-System zu verwen- 
den, das in der Lage ist, sowohl Befehle auf hohem Niveau einer Programmiersprache zu kompilieren als auch 
die zuvor erwahnten Befehle auf hohem Niveau fur spezielle Zwecke. Die angestrebte Ausgabe bzw. Sollausga- 
be eines derartigen Kompilier-Sys terns ist ein Code in Assemblersprache fur konventionelle Instruktionen auf 
hohem Niveau einer Programmiersprache und in ein Code einer Hardware-Beschreibungssprache bzw. einer 
"Hardware Description Language* (HDL) fOr Befehle zu speziellen Zwecken. UnglQcklicherweise stellt die 
automatisehe Bestimmung einer Gruppe von rekonfigurierbaren Hardware-Systemelementen und ein Schema 
bezuglich ihrer Verbindung, um eine optimale Rechenleistung fur jeglichen bestimmten Algorithmus, der gerade 
betrachtet wird, ein NP-Hard-Problem bzw. "NP-hanT-Problem dar. Ein Fernziel gewisser ARP-Systeme ist die 
Entwicklung eines Kompiliersystems, das einen Algorithmus direkt in ein optimiertes Schema bezuglich der 
Verbindungen untereinander fQr eine Gruppe von Gattern kompilieren kann. Die Entwicklung eines derartigen 
Kompiliersystems ist jedoch eine auBerordentlich schwierige Aufgabe, insbesondere wenn man die vielfachen 
Typen von Algorithmen betrachtet 

Ein zweiter Nachteil von ARP-Architekturen tritt auf, weil ein ARP-Apparat die Berechnungsarbeit, die mit 
dem Algorithmus verbunden ist, fur den er konfiguriert worden ist, fiber eine Vielzahl rekonfigurierbarer 
Logikvorrichtungen verteilt Zum Beispiel wird bei einem ARP-Apparat, der reaiisiert wurde, indem eine 
Gruppe von feldprogrammierbaren Logikvorrichtungen bzw. "Field Programmable Logic Devices* (FPGAs) 
verwendet wurde, und der konfiguriert wurde, um eine parallele Multiplikations-Beschleunigungseinrichtung zu 
implementieren, die Berechnungsarbeit, die mit der parallelen Multiplikatton verbunden ist, fiber die gesamte 
Gruppe der FPGAs verteilt Deshalb ist die GroBe des Algorithmus, bezuglich dem der ARP-Apparat konfigu- 
riert werden kann, auf die Anzahl der vorliegenden rekonfigurierbaren Logikvorrichtungen beschrankt In 
ahnlicher Weise ist die maximale DatensatzgroBe, die der ARP-Apparat handhaben kann, beschrankt Eine 
Untersuchung von Sourcecodes bzw. Quellcodes h'eferten nicht notwendigerweise einen klaren Hinweis auf die 
Beschrankungen des ARP-Apparats, weil einige Algorithmen Daten-Abhangigkeiten aufweisen konnen. Im 
allgemeinen werden datenabhangige Algorithmen vermieden. 

Da weiter ARP-Architekturen die Verteilung von Rechenarbeit fiber mehrere rekonfigurierbare Logikvor- 
richtung lehren. erfordert die Anpassung eines neuen (oder sogar leicht modifizierten) Algorithmus, daB die 
Rekonfiguration massiv durchgefuhrt werden muB, d h. die mehreren rekonfigurierbaren Logikvorrichtungen 
mOssen rekonfiguriert werden. Dies beschrankt die maximale Rate, bei der eine Rekonfiguration fur alternative 
Probleme oder Kaskaden-Unterprobleme bzw. hintereinandergeschaltete Unterprobleme auftreten kana 

Ein dritter Nachteil von ARP-Architekturen ergibt sich aus der Tats ache, daB eine oder mehrere Abschnitte 
des Programmcodes auf dem Host ausgefuhrt werden. Das heiBt ein ARP-Apparat ist nicht selbst ein unabhangi- 
ges Computersystem bzw. Rechensystera, der ARP-Apparat ffihrt nicht ganze Programme aus und es ist deshalb 
eine Wechselwirkung mit dem Host notwendig. Da etwas von dem Programmcode auf dem nicht rekonfigurier- 
baren Host ausgefuhrt wird, wird die Gruppe bzw. der Satz an verffigbaren Silizium-Resourcen nicht maximal 
fiber den Zeitrahmen der Progranimausffihrung ausgenutzt Insbesondere wahrend der Ausubung von Instruk- 
tionen bzw. Befehlen auf Host-Basis, werden die Silizium-Resourcen bzw. Silizium-Systemelemente auf dem 
ARP-Apparat untatig sein oder ineffizient verwendet werden. In ahnlicher Weise werden, wenn der ARP-Appa- 
rat mit Daten arbeitet, die Silizium-Resourcen bzw. die Silizium-Systemelemente auf dem Host ira allgemeinen 
ineffizient verwendet werden. Um leicht mehrere ganze Programme auszuffihren, mfissen die Silizium-Resour- 
cen bzw. die Siliziura-Systemeinheiten in leicht wiederverwendbare Resourcen bzw. Systemeinheiten kopiert 
werden. Wie vorstehend beschrieben wurde, behandeln ARP-System rekonfigurierbare Hardware-Systemele- 
mente als eine Gruppe von Gattern bzw. Gates, die optimal untereinander verbunden sind, um einen bestimmten 
Algorithmus zu einer bestimmten Zeit zu implementieren. Somit Iiefern ARP-Systeme nicht eine Einrichtung, 
um einen bestimmten Satz bzw. eine bestimmte Gruppe an rekonfigurierbaren Hardware-Systemelementen als 
ein leicht von einem Algorithmus zum anderen wiederverwendbares Systemelement zu behandeln, weil die 
Wiederverwendbarkeit ein gewisses Niveau an Unabhangigkeit bezuglich des Algorithmus erfordert 
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Ein ARP-Apparat kann nicht das gegenwartig ausgefOhrte Hostprogramm als Datea bchandeln und kann im 
allgemeinen nicht sich selbst kontextualisieren. Ein ARP-Apparat kann nicht leicht so hergestellt werden, daB er 
sich selbst durch das AusfOhren seines eigenen Hostprogramms simuliert Weiter kann ein ARP-Apparat nicht 
hergestellt werden, urn seine eigene HDL oder seine eigenen Anwendungsprogramme auf ihn selbst zu kompi- 
5 lieren, wobei er direkt die rekonfigurierbaren Hardware-Systemelemente bzw. Hardware-Resourcen verwen- 
det, aus denen er aufgebaut ist Ein ARP-Apparat ist somit bezuglich seiner Architektur bezuglich in sich 
geschlossener Rechenmodelle beschrankt, die die Unabhangigkeit von einem Hostprozessor lehreit 

Weil ein ARP-Apparat als eine Rechen-Beschleunigungseiririchtung wirkt, ist er im allgemeinen nicht in der 
Lage, eine unabhangige Eingangs-/Ausgangs- bzw. Input/Output* (IZO)-Verarbeitung durchzufOhrea Typi- 
10 scherweise erfordert ein ARP-Apparat eine Wechselwirkung mit dem Host fur eine I/O-Verarbeitung. Die 
Leistungsfahigkeit eines ARP-Apparats kann deshalb bezfiglich des I/O beschrankt sein. Fachleute werden 
erkennen, daB ein ARP-Apparat jedoch konfiguriert werden kann, urn ein spezielles I/O-Problera zu beschleuni- 
gen. Da jedoch der gesarate ARP-Apparat auf ein einziges, spezielles Problem hin gestaltet bzw. konfiguriert ist, 
kann ein ARP-Apparat die I/O-Verarbeitung nicht mit der Datenverarbeitung balancieren, ohne bezuglich des 
ts einen oder des anderen einen ICompromiB einzugehen. Daruber hinaus stellt ein ARP-Apparat keine Einrich- 
tung fQr die Interruptverarbeitung bereit Die Lehren bezuglich eines ARP*s bieten keine derartigen Mechanis- 
men an, da sie auf eine maximale Beschleunigung des Rechnens hin ausgerichtet sind und die Unterbrechung sich 
negativ auf die Rechenbeschleunigung auswirkt 

Ein vierter Nachteil von ARP-Architekturen existiert, da es Software-Applikationen gibt, die eine inharente 
20 Datenparallelhat besitzen, wobei es schwierig ist, diese auszunutzen, indera ein ARP-Apparat verwendet wird. 
HDL-Kompilierungs-Anwendungen liefern ein derartiges Beispiel, wenn eine Netz-Namen-Symbolaufldsung in 
einer sehr groBen Netzliste bendtigt wird. 

Ein fOnfter Nachteil, der mit ARP-Architekturen verbunden ist, ist, daB es im wesentlichen ein SIMD-Compu- 
terarchitekturmodell gibt ARP-Architekturen sind deshalb weniger bezuglich ihrer Architektur ef f ektiv, als ein 
25 oder mehrere innovative nicht-rekonfigurierbare Systeme nach dem Stand der Technik. ARP-Systeme spiegeln 
nur einen Teil des Prozesses der AusfOhrung eines Programms wider, hauptsachlich die arithmetische Logik fur 
eine arithmetische Berechnung, und zwar fQr jeden spezifischen Konfigurationsfall, und zwar fur so viel Rechen- 
leistung, wie die verfugbare rekonfigurierbare Hardware liefern kann. Im Gegensatz dazu nutzte nach dem 
Systemdesign der SYMBOL-Maschine bei Fairchild 1971 der gesamte Computer einen einzigen Hardware- 
30 Kontext fur jeden Aspekt der ProgrammausfOhrung. Infolgedessen umfaflte SYMBOL jedes Element fur die 
Systemanwendung eines Computers, einschlieBlich des Hostabschnittes, der durch ARP-Systeme gelehrt bzw. 
angewiesen wird. 

ARP-Architekturen weisen andere Unzulanglichkeiten ebenso auf. Zura Beispiel f ehlt es einem ARP-Apparat 
an einer effektiven Einrichtung, urn ein unabhangiges Tuning bzw. eine unabhangige Zeitsteuerung fur vielfach 

35 rekonfigurierbare Logikvorrichtungen bereitzustellen. Ahnlich fehlt es einem kaskadierten ARP-Apparat an 
einer wirksamen Takt-Verteilungseinrichtun& urn unabhangig getimte Einheiten bzw. Einheiten, die bezuglich 
ihrer Zeitsteuerung unabhangig sind, bereitzustellen. Nach einem anderen Beispiel ist es schwierig, genau die 
AusfUhrungszeit mit den Quellencode-Anweisungen zu korrelieren, fur die eine Beschleunigung beabsichtigt 
wird. Fur eine genaue Abschatzung der Netzsystem-Taktrate muB die ARP-Vorrichtung mit einem Werkzeug 

40 fur computerunterstQtztes Design bzw. mit einem "Computer-Aided Design (CAD)"-Tool nach einer HDL- 
Kompilierung modelliert werden, dies ist ein zeitaufbrauchender ProzeB, ura zu einem derartigen Basisparame- 
ter zu gelangen. 

Was gebraucht wird, ist eine Einrichtung zura rekonfigurierbaren Rechnen, die die Beschrankungen des oben 
beschriebenen Standes der Technik uberwindet. 

45 Die vorliegende Erfindung betrifft ein System und ein Verfahren fur skalierbares, paralleles, dynamisch 
rekonfigurierbares Rechnen. Das System weist wenigstens eine S-Maschine, eine T-Maschine, die jeder S-Ma- 
schine entspricht, eine Allzweck-Verbindungsmatrix (GPIM), eine Gruppe von I/O-T-Maschinen, eine oder 
mehrere I/O-Vorrichtungen und eine Master-Zeitbasis-Einheit auf. In der bevorzugten Ausfuhrungsform bein- 
haltet das System mehrere S-Maschinen. Jede S-Maschine weist einen Eingang bzw. einen Ausgang auf, der mit 

50 einem Ausgang bzw. einem Eingang der entsprechenden T-Maschine verbunden ist Jede T-Maschine beinhaltet 
einen Leitweg-Eingang bzw. FOhrungs-Eingang und einen Leitweg-Ausgang bzw. FOhrungs-Ausgang, der mit 
der GPIM verbunden ist, wie dies auch bei jeder I/O-T-Maschine der Fall ist. Eine I/O-T-Maschine beinhaltet 
weiter einen Eingang und einen Ausgang, der mit einer I/O-Vorrichtung verbunden ist SchlieBIich weist jede 
S-Maschine, T-Maschine und I/O-T-Maschine einen Master-Zeitsteuer-Eingang bzw. einen Master-Timing-Ein- 

55 gang auf, der mit einem Zeitsteuer- Ausgang bzw. Timing- Ausgang der Master-Zeitbasiseinheit verbunden ist 

Die Master-Zeitbasiseinheit liefert eine systemweite Frequenzreferenz an jede S-Maschine, T-Maschine und 
I/O-T-Maschine. Jede S-Maschine ist ein Computer, der eine Verarbehungseinheit aufweist, die selektiv rekonfi- 
guriert werden kann, und zwar wahrend der Ausfuhrung von Programminstruktionea Jede T-Maschine ist eine 
Datentransfervorrichtung bzw. Dateniibertragungsvorrichtung. Die GPIM liefert eine skalierbare Punkt-zu- 

60 Punkt-Parallel-Verbindungseinrichtung zur Kommunikadon zwischen T-Maschinen, Zusammengenommen 
stellt der Satz an T-Maschine und die GPIM eine skalierbare Punkt-zu-Punkt-Parallelverbmdungseinrichtung 
zur Kommunikation zwischen S-Maschinen bereit 

Eine S-Maschine umfaBt vorzugsweise eine erste tokale Zeitbasiseinheit, einen Speicher und eine dynamisch 
rekonfigurierbare Verarbeitungseinheit bzw. eine "Dynamically Reconfigurable Processing Unit" (DRPU). Die 

65 erste lokale Zeitbasiseinheit umfaBt einen Zeitsteuerungseingang bzw. einen Timingeingang, der mit der Master- 
Zeitbasiseinheit verbunden ist, und einen Zeitsteuerungsausgang bzw. Timingausgang, der mit einem Zeitsteue- 
rungseingang der DRPU und einem Zeitsteuerungseingang des Speichers flber die erste Zeitsteuerungs-Signal- 
leitung verbunden ist Die DRPU umfaBt einen Steuersignalausgang, einen Adressenausgang bzw. einen bidirek- 
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tionalen Da ten port, dcr mit einem Steuersignaieingang, einera Adresseneingang bzw. einem bidirektionalen 
Datenport des Speichers Qber eine Speichers teuerleitung, eine Adressenleitung bzw. eine Speicher-I/O-Leitung 
verbunden ist Die DRPU weist ebenso einen bidirektionalen Steuerport auf, der mit einem bidirektionalen 
Steuerport ihrer entsprechenden T-Maschine uber eine externe Steuerieitung verbunden ist 

Die erste lokale Zeitbasiseinheit erapfangt ein Master-Zeitsteuersignal von der Master-Zeitbasiseinheit und 5 
erzeugt ein erstes lo kales ZeitsteuersignaJ, das zu der DRPU und dem Speicher Qber eine erste Zeitsteuersignal- 
leitung geliefert wird. Bei dem Speicher handelt es sich vorzugsweise urn einen Speicher mit wahlfreiem Zugriff 
bzw. ein "Random Access Memory (RAM), das Prograniminstniktionen, Programmdaten und eine oder mehre- 
re Konfigurationsdatensatze speichert Bei der bevorzugten Ausfuhmngsform ist ein gegebener S-Maschinen- 
speicher fur jede andere S-Maschine in dem System fiber die GPIM und ihre korrespondierende T-Maschine to 
zuganglich. 

Eine Gruppe von Programminstruktionen bzw. Programmbefehlen, die darauf ausgerichtet sind bzw. speziali- 
siert sind, einen spezifischen Satz von BefehJen bezuglich potentiell groBen Datensatze durchzufuhren, wird 
hierin als ein "Innenschleifen*- bzw. "Inner-Loop"-Abschnitt eines Programms bezeichnet Eine Gruppe von 
Programniinstriiktionen, die fQr das Durchfahren von Allzweckoperationen und/oder fur das Obertragen der 15 
Steuerung von einem Innenschleifenabschnitt zu einem anderen verantwortlich ist, wird hierin als *Au8enschlei- 
fen"- bzw. "Outer-Loop'VAbschnitt des Programms bezeichnet Innerhalb jedes gegebenen Programms besteht 
jeder InnenschJeifenabschnitt vorzugsweise a us einer kleinen Anzahl von Instruktionstypen, wahrend AuBen- 
schieifenabschnitte vorzugsweise eine Mannigfaltigkeit bzw. VielzahJ von Allzweck-Instrukdoostypea beinhal- 
teiL 20 

Jeder Konfigurationsdatensatz, der in dem Speicher gespeichert ist spezifiziert eine DRPU-Hardware-Organ- 
isation, die fttr die Implementation bzw. Realisierung einer entsprechenden Befehlssatzarchitektur bzw. Instruk- 
tionssatzarchitektur (Instruction Set Architecture" bzw. ISA) optimiert ist Eine ISA ist ein primitiver Satz von 
Instruktionen, der verwendet werden kann, urn einen Computer zu programmieren. GemaB der vorliegenden 
Erfmdung kann eine ISA kategoristert werden als eine Innenschleifen-ISA oder eine AuBenschJetfen-ISA, und 25 
zwar gemaB der Anzahl und Typen von Instruktionen, die sie eathalt Eine Innenschleif en-ISA besteht aus relativ 
wenig Instruktionen, und zwar wo die Instruktionen nQtzlich sind, urn spezifische Typen von Operationen 
durchzufQhren. Eine Auflenschleifen-ISA beinhaltet mehrere Instruktionen, und zwar wo die Instruktionen 
nQtzlich sind, um eine VielzahJ von Ailzweck-Operationen durchzufuhren. 

Programminstruktionen, die in dem Speicher gespeichert sind, beinhalten selektiv eine oder mehrere Rekonfi- 30 
gurations-Anweisungen, und zwar wo jede Rekonfigurationsanweisung auf einen Konfigurationsdatensatz Be- 
zug nimmt Wahrend der Programmausfuhrung durch die DRPU konnen eine oder mehrere Rekonfigurations- 
anweisungen gewahlt werden. Die Auswahl von gegebenen Rekonfigurationsanweisungen fuhrt zu einer Re- 
konfiguration der DRPU-Hardware gemaB dem Konfigurationsdatensatz, auf dem durch die Rekonfigurations- 
anweisung Bezug genommen wird. Somit wird nach der Auswahl einer Rekonfigurationsanweisung die DRUP- 35 
Hardware rekonfiguriert, ura eine optimierte Implementation einer bestimmten ISA bereitzustellen. GemaB der 
vorliegenden Erfindung wird eine Rekonfiguration der DRPU ebenso in Antwort auf einen Rekonfigurationsin- 
terrupt ausgelost und zwar wo der Rekonfigurationsinterrupt auf einen Konfigurationsdatensatz Bezug nimmt 
der einer ISA in der oben beschriebenen Art und Weise entspricht 

Die DRPU umfaBt eine Instruktionsabrufeinheit bzw. Instruction Fetch Unit* (IFU), eine Datenoperations- 40 
einheit bzw. "Data Operate Unit* (DOU) und eine Adressenoperationseinheit bzw. 'Address Operate Unit" 
(AOU), wobei jede dynamisch rekonfigurierbar ist Bei der bevorzugten AusfQhrungsform wird die DRPU 
implementiert indem eine rekonfigurierbare Logikvorrichtung, wie z. B. ein Xilinx XC4013 programmierbares 
Gatter- Array bzw. "Programmable Gate Array" (FPGA) verwendet wird. Die reprograramierbare Logikvor- 
richtung liefert vorzugsweise eine Vielzahl von selektiv reprograramierbaren 1) Logikblocken oder konfigurier- 45 
baren Logikblocken bzw. "Configurable Logic Blocks* (CLBs); 2) I/O-Bldcke (IOBs); 3) Verbindungsstrukturen; 
4) Datenspeicher-Systemeinheiten; 5) Dreizustands-Puffer-Systemeinheiten; und 6) Fahigkeiten einer fest ver- 
drahteten Logik. 

Die IFU umfaBt einen Speichersteuerausgang, der den Speichersteuerausgang der DRPU biklet, einen Daten- 
eingang, der mit der Speicher-I/O-Leitung verbunden ist und einen bidirektionalen Steuerport, der den bidirek- 50 
tionalen Steuerport der DRPU bildet Die IFU umfaBt zusatzltch einen ersten, zweiten und dritten Steueraus- 
gang. Die DOU und die AOU umfassen jeweils einen bidirektionalen Datenport, der mit der Speicher-I/O-Lei- 
tung verbunden ist, und die AOU umfaBt einen Adressenausgang, der mit der Adressenleitung verbunden ist Die 
DOU umfaBt einen ersten Steuereingang, der mit dem erst en Steuerausgang der IFU uber eine erste Steueriei- 
tung verbunden ist Die AOU umfaBt einen ersten Steuereingang, der rait dem zweiten Steuerausgang der IFU 55 
Ober eine zweite Steuerieitung verbunden ist SowohJ die DOU als auch die AOU umfassen einen zweiten 
Steuereingang, der mit dem dritten Steuerausgang der IFU Qber eine dritte Steuerieitung verbunden ist 
SchlieBlich umfassen sowohl die IFU als auch DOU und die AOU einen Zeitsteuereingang, der mit der ersten 
Zeitsteuersignalleitung verbunden ist 

Die IFU verwaltet Instruktionenabruf- und Instruktionen-Decodieroperatioaen, Speicherzugriffsoperationen, 60 
DRPU-Rekonfigurationsoperationen und gibt Steuersignale zu der DOU und der AOU aus, um die Ausfuhrun- 
gen der Instruktionen zu erleichtern. Die IFU umfaBt vorzugsweise einen Architekturbeschreibungsspeicher, 
eine Instruktionszustands-Folgesteuerungseinheit bzw. einen "Instruction State Sequencer" (ISSX eine Spetcher- 
zugriffslogik, eine Rekonfigurationslogik, eine Interruptlogik, eine Abrufsteuereinheit einen Instruktionspuffer, 
eine Decodiersteuereinheit einen Instruktionsdecoder, einen Opcode- bzw. Operationscode-Speicherregister- 65 
satz, einen Registerdatei- bzw. RegisterfUe-(RF)-Adressenregistersatz, einen KLonstantenregistersatz und einen 
ProzeBsteuerregistersatz. Die ISS umfaBt einen ersten bzw. einen zweiten Steuerausgang, der die ersten bzw. 
zweiten Steuerausgange der IFU umfaBt; einen Zettsteuerungseingang, der den Zeitsteuerungseingang der IFU 
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ausbiidet; einen Abruf-/Decodiersteuerausgang, der mit einem Steuereingang dcr Abrufsteuereinheit und einem 
Steuereingang des Decodiersteuereingangs verbunden ist; einen bidirekrionalen Steuerport, der mit einem 
ersten b i dire kt ion ale n Steuerport sowohl der Speicherzugriffslogik als auch der Rekonfigurationslogik und der 
Interruptlogik verbunden ist; einen Operatioascodeeingang, der mit einem Ausgang des Operationscodespeich- 
5 erregistersatzes verbunden ist; einen bidirektionalen Datenport, der mit einem bidirektionalen Datenport des 
ProzeBsteuerregistersatzes verbunden ist Sowohl die Speicherzugriffslogik als auch die Rekonfigurationslogik 
und die Interruptlogik urafaBt einen zweiten bidirektionalen Steuerport, der mit der exteraen Steuerleitung 
verbunden ist; einen Dateneingang, der mit einem Datenausgang des Architekturbeschreibungsspetchers ver- 
bunden ist Die Speicherzugriffslogik umfaflt ebenso einen Steuerausgang, der den Speichersteuerausgang des 
io IFU ausbiidet und die Interruptlogik umfaBt zusatzlich einen Ausgang, der mit dem bidirektionalen Datenport 
des Verarbeitungs- bzw. ProzeBsteuerregistersatzes verbunden ist 

Der Architektur-Beschreibungsspeicher umfaBt vorzugsweise einen Speicher zum Speichern der Architektur- 
Spezifikationssignale, die die DRPU- (Configuration zu jeder gegebenen Zeit kennzeichnen. Die Architektur- 
Spezifikationssignale beinhalten vorzugsweise eine Referenz zu einem vorgegebenen Konfigurationsdatensatz 

15 bzw. Default-Datensatz; eine Referenz bzw. einen Bezug auf eine Liste von ermdglichbaren Konfigurationsda- 
tensitzen; ein atomares Speicher- Adresseninkrement; und einen Satz von Interrupt- Antwortsignalen, die spezi- 
fizieren, wie die gegenwartige DRPU-Hardware-Konfiguration auf die Interrupts antwortet Die ISS umfaBt 
vorzugsweise eine Zustandsmaschine, die das AusfQhren von Instruktionen innerhalb der gegenwartig betrach- 
teten ISA erleichtert, indem Signale zu der Abrufsteuereinheit, der Decodiersteuereinheit der DOU, der AOU 

20 und der Speicherzugriffslogik ausgegeben werden. Die ISS gibt DOU-Steuersignale auf die erste Steuerleitung, 
AOU-Steuersignale auf die zweite Steuerleitung und RF-Adressen und -Konstanten auf die dritte Steuerleitung. 
Die Interruptlogik umfaBt vorzugsweise eine Zustandsmaschine, die vorzugsweise Interrupt- Meldungsoperatio- 
nen durchfOhrt Die Rekonfigurationslogik umfaBt vorzugsweise eine Zustandsmaschine, die Rekonfigurations- 
Operationen in Antwort auf ein Rekonfigurationssignal durchfOhrt In der bevorzugten Ausffihrungsform wird 

25 das Rekonfigurationssignal in Antwort auf einen Rekonf igurationsinterrupt oder, wenn eine Rekonfigurations- 
anweisung ausgewahlt wird, wahrend der Programmausfuhrung erzeugt 

Die DOU ffihrt Operationen aus, die zu Datenberechnungen in bezug stehen, und zwar in Obereinstimmung 
mit DOU-Steuersignalen, RF-Adressen und Konstanten, die von der IFU empfangen werden. Die DOU umfaBt 
vorzugsweise einen DOU-Crossbar-Schalter, eine Abspeicher-/Ausrichtlogik und eine Datenoperationslogik. 

30 Der DOU-Crossbar-Schalter ("X-Bar-Schalter") umfaBt einen bidirektionalen Datenport der den bidirektiona- 
len Datenport der DOU ausbiidet; einen Konstanteneingang, der mit der dritten Steuerleitung der IFU verbun- 
den ist; einen ersten Daten-Feedback-Eingang bzw. Daten-Ruckfuhr-Eingang, der mit einem Datenausgang der 
Datenoperationslogik verbunden ist; einen zweiten Daten-Feedback-Eingang bzw. Daten-Ruckfuhr-Eingang, 
der mit einem Datenausgang der Abspeicher-ZAusrichtlogik verbunden ist; einen Datenausgang, der mit einem 

35 Dateneingang der Abspeicher-ZAusrichtlogik verbunden ist Die Abspeicher-/Au$richtlogik beinhaltet einen 
Adresseneingang, der mit der dritten Steuerleitung verbunden ist, und die Datenoperationslogik beinhaltet einen 
Dateneingang, der mit dem Ausgang der Abspeicher-AAusrichtlogik verbunden ist SchlieBlich umfaBt sowohl 
der DOU-Crossbar-Schalter als auch die Abspeicher-ZAusrichtlogik und die Datenoperationslogik einen Steuer- 
eingang, der mit der ersten Steuerleitung verbunden ist 

40 Der E|OU-Crossbar-Schalter ladt die Daten von dem Speicher, Gbertragt Ergebnisse, die von der Datenopera- 
tionslogik ausgegeben werden, zu der Abspeicher-/Ausrichtlogik oder dem Speicher und ladt Konstante, die 
durch die IFU in Antwort auf die DOU-Steuersignale, die an ihrem Eingang empfangen werden, ausgegeben 
werden. Die AbspeicherVAusrichtlogik stellt eine temporare Speicherung fur Operanden, Konstante und Teiler- 
gebnisse bereit, die mit den Datenberechnungen verbunden sind. Die Datenoperationslogik fuhrt arithmetische, 

45 Schiebe- und/oder logische Operationen in Antwort auf die DOU-Steuersignale, die bei ihrem Steuereingang 
empfangen werden, durch. 

Die AOU ftihrt Operationen durch, die in Beziehung zu der Adressenberechnung stehen, und umfaBt vorzugs- 
weise einen AOU-Crossbar-Schalter, eine Abspeicher-ZZahllogik, eine Adressenoperationslogik und einen 
Adressenmultiplexer. Der AOU-Crossbarschalter umfaBt einen bidirektionalen Datenport, der den bidirektiona- 

50 ten Datenport der AOU ausbiidet; einen Adressen-RQckfOhreingang, der mit einem Adressenausgang der 
Adressenoperationslogik verbunden ist; einen Konstanteneingang, der mit der dritten Steuerleitung verbunden 
ist; und einen Adressenausgang, der mit einem Adresseneingang und der Abspeicher-ZZahllogik verbunden ist 
Die Abspeicher-/Zahllogik beinhaltet einen RF-Adresseneingang, der mit der dritten Steuerleitung verbunden 
ist, und einen Adressenausgang, der mit einem Adresseneingang der Adressenoperationslogik verbunden ist 

55 Der Adressenmultiplexer umfaBt einen ersten Eingang, der mit dem Adressenausgang der Abspeicher-ZZahllo- 
gik verbunden ist, und einen zweiten Eingang, der mit dem Adressenausgang der Adressenoperationslogik 
verbunden ist Sowohl der AOU-Crossbar-Schalter als auch die Abspeicher-ZZahllogik und die Adressenopera- 
tionslogik umf assen einen Steuereingang, der mit der zweiten Steuerleitung verbunden ist 

Der AOU-Steuerschalter ladt Adressen aus dem Speicher, ubertragt Ergebnisse, die von der Adressenopera- 

go tionslogik ausgegeben wurden, zu der Abspeicher-/Zahiiogik oder dem Speicher und ladt Konstante, die von der 
IFU ausgegeben wurden, in die Abspeicher-/Zahllogik in Antwort auf die AOU-Steuersignale, die an seinem 
Eingang empfangen werden. Die Abspeicher-/Zahllogik stellt eine temporare Speicherung von Adressen und 
Adressenberechnungsergebnissen bereit Die Adressenoperationslogik fuhrt arithmetische Operationen bezug- 
lich der Adressen in Obereinstimmung mit den AOU-Steuersignalen durch, die bei ihrem Steuereingang erapfan- 

65 gen werden. Der Adressenmultiplexer wahlt selektiv eine Adresse aus, die von der AbspeicherVZahllogik oder 
der Adressenoperationslogik empfangen werden, aus, und zwar in Obereinstimmung mit den AOU-Steuersigna- 
len, die bei seinem Steuereingang empfangen werden. 

Jedes Element innerhalb der IFU, der DOU und der AOU wird implementiert bzw. realisiert, indem rekonfigu- 
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rierbare Hardware-Systemelemente innerhalb der rekonfigurierbaren Logikvorricbtung verwendet werden, wie 
es durch einen gegebenen Konfigurationsdatensatz spezifiziert ist, der einer bestimraten ISA entspricht. Die 
detaillierte interne Struktur der Elemente innerhalb der IFU, der DOU und der AOU variiert vorzugsweise in 
Abhangigkeit von dera Typ der ISA, fGr den die DRPU konfiguriert ist, urn zu jedem gegebenen Augenblick zu 
implementieren bzw. zu realisieren. Far eine AuBenschleifen-lSA ist die interne Struktur eines jeden Elements 5 
innerhalb der IFU, der DOU und der AOU vorzugsweise fur die serielle Instruktionsverarbeitung optinuert Fur 
eine Innenschleifen-ISA ist die interne Struktur eines jeden Elements innerhalb der IFU, der DOU und der AOU 
vorzugsweise fur die paraUele Instruktionsverarbeitung optimiert 

Jede T-Maschine umfaBt vorzugsweise eine gemeinsame Schnittstellen und Steuereinheit bzw. "common 
interface control unit", einen Satz an Verbindungs-I/O-Einheiten und eine zweite lokale Zeitbasiseinheit Die 10 
zweite lokale Zeitbasiseinheit umfaBt einen Zeitsteuerungseingang, der mit der Master-Zeitbasiseinheit verbun- 
den ist, und einen Zeitsteuerungsausgang, der mit einem Zeitsteuerungseingang der gemeinsamen schnittstellen- 
und Steuereinheit verbunden ist Die gemeinsame Schnittstellen- und Steuereinheit umfaBt einen Adressenaus- 
gang t der mit der Adressenleitung verbunden ist, einen ersten bidirektionalen Datenport, der mit der Speicher- 
I/O-Leitung verbunden ist, einen bidirektionalen Steuerport, der mit der externen Steuerleitung verbunden ist, is 
und einem zweiten bidirektionalen Datenport, der mit einem bidirektionalen Datenport eines jeden seiner 
assoziierten Verbindungs-I/O-Einheiten verbunden ist 

Die zweite lokale Zeitbasiseinheit erzeugt ein zweites lokales Zeitbasissignat das von der Master-Fre<menzre- 
ferenz abgeleitet wird, die von der Master-Zeitbasiseinheit empfangen wird. Die gemeinsame schnittstellen- und 
Steuereinheit verwaltet den Transfer von Daten und Befehlen zwischen seiner entsprechenden S-Maschine und 20 
einer seiner zugeordneten Verbindungs-I/O-Einheiten. Jede Verbindungs-I/O-Einheit fibertragt Nachrichten 
bzw. Meldungen, die von ihrer zugeordneten gemeinsamen Schnittstellen- und Steuereinheit empfangen wird, zu 
einer anderen Verbindungs-I/O-Einheit fiber die GPIM. Jede Verbindungs-I/O-Einheit fibertragt ebenso selek- 
tiv Nachrichten, die von anderen Verbindungs-I/O-Einheiten empfangen werden, zu ihrer zugeordneten gemein- 
samen Schnittstellen- und Steuereinheit 25 

Jede I/O-T-Maschine umfaBt vorzugsweise eine gemeinsame Kunden-Schnittstellen- und Steuereinheit, eine 
Verbindungs-I/O-Einheit und eine dritte lokale Zeitbasiseinheit Die internen Verbindungen bzw. Kopplungen 
innerhalb einer I/O-T-Maschine sind zu jenen innerhalber einer T-Maschine analog; jedoch wird eine I/O-T-Ma- 
schine eher mit einer VO-Vorrichtung bzw. ein I/O-Bauelement verbunden als mit einer S-Maschine, sie enth&lt 
deshalb Verbindungen, die fur eine bestimmte I/O-Vorrichtung spezifisch sind. Ober ihre entsprechende T-Ma- 30 
schine, die GPIM und eine I/O-T-Maschine kommuniziert eine S-Maschine mit einer bestimraten I/O-Vorrich- 
tung in dem System. 

Die GPIM liefert eine skah'erbare Punkt-zu-Punkt-Verbmdungseinrichtung fur eine paraUele Kommunikation 
zwischen T-Maschinen. Der Satz an T-Maschinen und die GPIM bilden zusammen eine skalierbare Punkt-zu- 
Punkt-Verbindungseinrichtung fur paraUele Kommunikation zwischen S-Maschinen. Die GPIM umfaBt vor- 35 
zugsweise ein Tc-ary, n-cube* bzw. k-n-kubisches statisches Verbindungsaetzwerk mit einer Anzahl erster 
Kommunikationskanale und einer Anzahl zweiter Kommunikationskanale. Jeder erste Kommunikauonskanal 
beinhaltet eine Vielzahl von Knotenverbindungsplatzen, wie dies bei jedem zweiten Verbindungskanal der Fall 
ist Jede Verbindungs-I/O-Einheit in dem System ist mit der GPIM derartig verbunden, daB mr Eingang mit 
einem bestimmten Knotenverbindungsplat z fiber eine Nachrichteneingangsleitung verbunden ist und ihr A us- 40 
gang zu einem anderen Knotenverbindungsplatz fiber eine Nachrichtenausgangsleitung verbunden ist Die 
GPIM ist somit ein skalierbares Netzwerk zum parallelen Lei ten bzw. Fuhren von Daten und Befehlen zwischen 
mehreren Verbindungs-I/O-Einheiten. 

Ira folgenden werden kurz die Zeichnungen beschrieben: 

Fig. I ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform eines Systems zum skalierbaren, parallelen, 45 
dynamisch rekonfigurierbaren Rechnen, das in Obereinstimmung mit der vorliegenden Erfmdung aufgebaut ist; 

Fig. 2 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer S-Maschine gemaB der vorliegenden 
Erfindung; 

Fig. 3 A ist ein exeraplarisches Programmes ting, das Rekonfigurationsanweisungen enthalt; 

Fig. 3B ist ein FluBdiagramm bekannter Kompilierungsoperationen, die wahrend der Kompilierung einer so 
Folge von Programminstruktionen ausgeffihrt werden; 

Fig. 3C und 3D sind FluBdiagramme der bevorzugten Kompilierungsoperationen, die von einem Kompiler 
zum dynamisch rekonfigurierbaren Rechnen durchgefuhrt werden; 

Fig. 4 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer dynamisch rekonfigurierbaren Verar- 
beitungseinheit bzw. einer "Dynamically Reoonfigurable Processing Unit* gemaB der vorliegenden Erfindung; 55 

Fig. 5 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Instruktionsabrufeinheit bzw. einer 
Instruction Fetch Unit" gemaB der vorliegenden Erfindung; 

Fig. 6 ist ein Zustandsdiagramm, das einen bevorzugten Satz von Zustanden zeigt, die durch eine Befehlszu- 
standsfolgesteuereinheit bzw. einen "Instruction State Sequencer* gemaB der vorliegenden Erfindung unter- 
stutzt werden; so 

Fig. 7 ist ein Zustandsdiagramm, das einen bevorzugten Satz von Zustanden zeigt, die durch eine Interruptlo- 
gik der vorliegenden Erfindung unterstutzt werden; 

Fig. 8 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Datenoperationseinheh bzw. einer 
"Data Operate Unit" der vorliegenden Erfindung; 

Fig. 9 A ist ein Blockdiagramm einer ersten beispielhaften Ausfuhrungsform der Datenoperationseinheit, die 65 
fur die Implementation bzw. Realisierung einer Instruktionssatz-Architektur bzw. einer "Instruction Set Archi- 
tecture* gemaB einer Allzweck-AuBenschieife konfiguriert ist; 

Fig. 9B ist ein Blockdiagramm fur eine zweite beispielhafte Ausfuhrungsform der Datenoperationseinheit, die 
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fQr die Implementation einer I nnenschleif en-Ins truktionssatz-Architektur konfiguriert ist; 

Fig. 10 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform fur eine Adressenoperationseinheit bzw. 
fur eine "Address Operate Unit* gemaB der vorliegenden Erfindung; 

Fig. 11 A ist ein Blockdiagramm einer ersten beispielhaften Ausfuhrungsform fur die Adressenoperationsein- 
heit, die ffir die Implementation bzw. Realisierung einer Instruktionssatz-Architektur gemaB einer AUzweck-Au- 
Benschleife konfiguriert ist; 

Fig. 11B ist ein Blockdiagramm fur eine zweite beispielhafte Ausfuhrungsform der Adressenoperationsein- 
heit, die fur die Implementation bzw. Verwirklichung einer Innenschleifen-Instruktionssatz-Architektur konfigu- 
riert ist; 

Fig. 12A ist ein Diagramm, das eine beispielhafte Zuordnung von rekonfigurierbaren Hardware-Systemein- 
heiten zwischen der Instruktionsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit 
fur eine Aufienschleifen-Instruktionssatz-Architektur zeigt; 

Fig. 12B ist ein Diagramm, das eine exemplarische Zuordnung von rekonfigurierbaren Hardware-Systemein- 
heiten zwischen der Instruktionsabrufeinheit, der Datenoperationseinheit und der Adressenoperationseinheit 
fur eine Innenschleif en-Instniktionssatz-Architektur zeigt; 

Fig. 13 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer T-Maschine der vorliegenden Erfin- 
dung; 

Fig. 14 ist ein Blockdiagramm einer Verbindungs-I/O-Einheit der vorliegenden Erfindung; 
Fig. 15 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer I/O-T-Maschine der vorliegenden 
Erfindung; 

Fig. 16 ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer Allzweck-Verbindungsmatrix bzw. 
einer "General Purpose Interconnect Matrix" der vorliegenden Erfindung; und 

Fig. 17A und 17B zeigen ein FluBdiagramm eines bevorzugten Verfahrens zum skalierbaren, paralleled 
dynamisch rekonfigurierbaren Rechnen in Obereinstimmungmit der vorliegenden Erfindung. 

Im folgenden werden die bevorzugten Ausfuhrungsforraen detailliert beschrieben: 
Fig. 1 zeigt ein Blockdiagramm einer bevorzugten Ausfuhrungsform eines Systems 10 zum skalierbaren, paralle- 
led dynamisch rekonfigurierbaren Rechnen, das in Obereinstimmung mit der vorliegenden Erfindung aufgebaut 
ist Das System 10 umfaBt vorzugsweise wenigstens eine S-Maschine 12, eine T-Maschine 14, die zu jeder 
S-Maschine 12 korrespondiert, eine Allzweck-Verbindungsmatrix bzw. "General Purpose Interconnect Matrix" 
(GPIM) 16, wenigstens eine I/O-T-Maschine 18, eine oder mehrere I/O-Vorrichtungen 20 und eine Master-Zeit- 
basiseinheit 22. Bei der bevorzugten Ausfuhrungsform umfaBt das System 10 mehrere S-Maschinen 12 und somit 
mehrere T-Maschinen 14 sowie mehrere I/O-T-Maschinen 18 und mehrere I/O-Vorrichtungen 20. 

Jede der S-Maschinen 12, T-Maschinen 14 und I/O-T-Maschinen 18 umfaBt einen Master-Zeitsteuerungsein- 
gang, der mit einem Zehsteuerungsausgang der Master-Zeitbasiseinheit 22 verbunden ist 

Jede S-Maschine 12 umfaBt einen Eingang und einen Ausgang, der mit threr entsprechenden bzw. korrespon- 
dierenden T-Maschine 14 verbunden ist Zusatzlich dazu, daB der Eingang und der Ausgang mit ihrer entspre- 
chenden bzw. korrespondierenden S-Maschine 12 verbunden ist, umfaBt jede T-Maschine 14 einen Leitwegein- 
gang bzw. Fuhrungseingang und einen Leitwegausgang bzw. Fuhrungsausgang, der mit der GPIM 16 verbunden 
ist In ahnlicher Art und Weise umfaBt jede I/O-T-Maschine 18 einen Eingang und einen Ausgang, der mit einer 
I/O-Vorrichtung 20 verbunden ist, und einen Leitweg eingang und einen Leitwegausgang, der mit der GPIM 16 
verbunden ist 

Wie detaillierter weiter unten beschrieben werden wird, handeit es sich bei jeder S-Maschine 12 urn einen 
dynamisch rekonfigurierbaren Computer bzw. Rechnen Die GPIM 16 bildet eine Punkt-zu-Punkt- Parallel- Ver- 
bindungseinrichtung, die die Kommunikation zwischen T-Maschinen 14 erleichtert Der Satz von T-Maschinen 
14 und die GPIM 16 bilden eine Punkt-zu-Punkt-Parallel-Verbindungseinrichtung ffir einen Datentransfer 
zwischen S-Maschinen 12. In ahnlicher Weise bilden die GPIM 16, der Satz von T-Maschinen 14 und der Satz 
von I/O-T-Maschinen 18 eine Punkt-zu-Punlrt-ParaUel-Verbindungseinrichtung fur einen I/O-Transfer bzw. fur 
eine I/O-Obertragung zwischen S-Maschinen 12 und jeder I/O-Vorrichtung 20. Die Master-Zeitbasiseinheit 22 
umfaBt einen Oszillator, der ein Master- Zeitsteuersignal fQr jede S-Maschine 12 und T-Maschine 14 liefert 

Bet einer beispielhaften Ausfuhrungsform ist jede S-Maschine 12 realisiert, indem ein Xilinx XC4013 (Xilinx, 
Inc, San Jose, CA, USA) feldprogrammierbares Gate-Array bzw. "Field Programmable Gate Array* (FPGA) 
verwendet wird, das mit 64 Megabyte Speicher mit wahlfreiem Zugriff bzw. "Random Access Memory* (RAM) 
verbunden ist. Jede T-Maschine 14 wird realisiert, indem unge&hr 50% der rekonfigurierbaren Hardware-Sy- 
stemelemente in einer Xilinx XC4013 FPGA verwendet werden, dies ist auch bei jeder I/O-T-Maschine 18 der 
FalL Die GPIM 14 ist als eine toroidale Verbindungsmasche bzw. Verbindungsvermaschung verwirkltcht Die 
Master-Zeitbasiseinheit 22 ist ein TaktosziUator, der mit dem Taktverteilungsschaitkreis verbunden ist, urn eine 
systemweite Frequenzreferenz zu lief ern, wie dies in der US-Patentanmeldung mit dem Titel "System und 
Verfahren fQr phasensynchrones Takten und phasensynchrone Nachrichtenubertragung mit flexibler Frequenz" 
bzw. 'System and Method for Phase-Synchronous, Flexible Frequency Clocking and Messaging" beschrieben ist 
Vorzugsweise iibertragen die GPIM 14, die T-Maschinen 12 und die I/O-T-Maschinen 18 Information in 
Obereinstimmung mit dem ANSI/IEEE-Standard 1596— 1992, der ein skalierbares koharentes Interface bzw. ein 
"Scalable Coherent Interface* (SCI) f estlegt 

Bei der bevorzugten Ausfuhrungsform umfaBt das System 10 mehrere S-Maschinen 12, die parallel arbeiten. 
Die Struktur und die Funktionalitat bzw. Wirkungsweise einer jeden einzelnen S-Maschine 12 sind weiter unten 
detailliert unter Bezugnahme auf die Fig. 2 bis 12B beschrieben. Nimmt man nun Bezug auf die Fig. 2, so ist ein 
Blockdiagramm einer bevorzugten Ausfuhrungsform einer S-Maschine 12 gezeigt Die S-Maschine 12 umfaBt 
eine erste Iokale Zeitbasiseinheit 30, eine dynamisch rekonfigurierbare Verarbeitungseinheit bzw. eine "Dynami- 
cally Reconfigurable Processing Unit" (DRPU) 32, um Programminstruktionen auszufuhren, und einen Speicher 
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34. Die crste Iokale Zeitbasiseuiheit 30 umfaBt einen Zeitsteueningseingang, der den Master-Zeitsteuerungsein- 
gang der S-Maschine a us b tide l Die erste Iokale Zeitbasiseuiheit 30 umfaBt ebenso einen Zeitsteuerungsausgang, 
der ein erstes lokales Zeitsteuerungssignal oder einen ersten lokalen Zeitsteuerungstakt zu einem Zeitsteue- 
ningseingang der DRPU 32 und einem Zeitsteueningseingang des Speichers 34 Qber eine erste Zeksteuerungssi- 
gnalieitung 40 liefert Die DRPU 32 umfaBt einen Steuersignalausgang, der mit einem Steuersignaleingang des s 
Speichers 34 uber eine Speichersteuerleitung 42 verbunden Est; einen Adressenausgang, der mit einem Adressen- 
eingang des Speichers 34 uber eine Adressenleitung 44 verbunden ist; einen bidirektionalen Datenport, der mit 
einem bidirektionalen Datenport des Speichers 34 uber eine Speicher-I/O-Leitung 46 verbunden ist. Die DRPU 
32 umfaBt zusatzlich einen bidirektionalen Steuerport, der mit einem bidirektionalen Steuerport ihrer entspre- 
chenden T-Maschine 14 uber eine externe Steuerleitung 48 verbunden ist. Wie in der Fig. 2 gezeigt, uberspannt 10 
die Speicfaereteueningsleitung 42 X Bits, die Adressenleitung 44 M Bits, die Speicher-I/O-Leitung 46 (N x k) Bits 
und die externe Steuerleitung 48 uberspannt Y Bits. 

Bei der bevorzugten Ausfuhrungsform eropfangt die erste Iokale Zeitbasiseuiheit 30 das Master-Zeitsteue- 
rungssignal von der Master-Zeitbasiseinheit 22. Die erste Iokale Zeitbasiseuiheit 30 erzeugt das erste Iokale 
Zeitsteuerungssignal aus dera Master-Zeitsteuerungssignal und liefert das erste Iokale Zeitsteuerungssignal zu is 
der DRPU 32 und dem Speicher 34. Bei der bevorzugten Ausfuhrungsform kann das erste Iokale Zeitsteuerungs- 
signal von einer S-Maschine 12 zu der anderen sich andern. Somit arbeiten die DRPU 32 und der Speicher 34 
innerhalb einer gegebenen S-Maschine 12 bei unabhangigen Taktraten relativ zu der DRPU 32 dem Speicher 34 
innerhalb irgendeiner anderen S-Maschine 1Z Vorzugsweise ist das erste Iokale Zeitsteuerungssignal mit dem 
Master-Zeitsteuerungssignal phasensynchronisiert Bei der bevorzugten Ausfuhrungsform ist die erste Iokale 20 
Zeitbasiseuiheit 30 realisiert, indem eine phasensynchronisierte Frequenzumwandlungsschaltung verwendet 
wird, einschlieBIich einer phasensynchronisierten Detektionsschaltung, die realisiert wird, indem rekonfigurier- 
bare Hardware-Systeraeinheiten verwendet werden. Fachleute werden erkennen, daB bei einer alternativen 
Ausfuhrungsform die erste Iokale Zeitbasiseuiheit 30 als ein Abschnitt eines Taktverteiiungsbaums realisiert 
werden kann. 25 

Der Speicher 34 wird vorzugsweise als ein RAM realisiert bzw. implementiert und speichert Programmin- 
struktionen, Programmdaten und Konfigurationsdatensatze fur die DRPU 32. Der Speicher 34 einer jeden 
gegebenen S-Maschine 12 ist vorzugsweise fur jede andere S-Maschine 12 in dem System 10 uber die GPIM 16 
zuganglich- DarQber hinaus ist jede S-Maschine 12 vorzugsweise dadurch gekennzeichnet, daB sie einen einheit- 
licnen bzw; gleichraaBigen Speicheradressenraum aufweist Bei .der bevorzugten AusfOhrungsforra enthalten 30 
Programminstruktionen, die in dem Speicher 34 gespeichert sind, seiektiv Rekonfigurationsanweisungen, die an 
die DRPU 32 gerichtet sind Nimmt man nun Bezug auf die Fig. 3A, so ist ein beispielhaftes Prograraralisting 50 
einschlieBIich der Rekonfigurationsanweisungen gezeigt Wie in der Fig. 3A gezeigt ist, beinhaltet das beispiel- 
haf te Programmlisting 50 einen Satz von AuBenschieif enabschnitten 52, einen ersten Innenschleifenabschnitt 54, 
einen zweiten Innenschleif enabschnitt 55, einen dritten Innenschletfenabschnitt 56, einen vierten Innenschleif en- 35 
abschnitt 57 und einen fOnften Innenschleifenabschnitt 58. Fachleute werden leicht erkennen, daB der Ausdruck 
Innenschleife" bzw. Inner-Loop" auf einen iterativen Abschnitt eines Program ms Bezug nimmt der fur die 
Durchfuhrung eines bestimmten Satzes von dazu in bezug stehenden Operationen verantwortlich ist, und der 
Term "AuBenschieif e* bzw. "Outer-Loop" nimmt auf jene Abschnitte eines Programms Bezug, die hauptsachlich 
fur die Durchfuhrung von Allzweckoperationen und/oder fur das Obertragen einer Steuerung von einem 40 
Innenschleifenabschnitt zu einem anderen verantwortlich ist Im allgeraeinen fuhren Innenschleifenabschnitte 
54, 55, 561, 57, 58 eines Programmes Operationen bezuglich potentiell groBer Datensatze durch. Bei einer 
Bildverarfoeitungsanwendung kann z. B. der erste Innenschleifenabschnitt 54 eine Farbformatumwandlungsope- 
ration bezuglich der Bilddaten durchfuhren und die zweiten bis funften Innenschleifenabschnitte 55, 56, 57, 58 
kdnnen ein lineares Filtern, Falten, Mustersuchen und Komprimierungsoperationen durchfuhren. Fachleute 45 
werden erkennen kdnnen, daB eine aneinanderliegende Abfolge von Innenschleifenabschnitten 55, 56, 57, 58 als 
eine Software-Pipeline bzw. ein Software-FlieBband gedacht werden kann. Jeder AuBenschleifenabschnitt 52 
ware fur den Daten-I/O und/oder fur die Anweisung des Transfers bzw. der Obertragung von Daten und der 
Steuerung von dem ersten Innenschleifenabschnitt 54 zu dem zweiten Innenschleifen-Abschnitt 55 verantwort- 
lich. Fachleute werden zusatzlich erkennen, daB ein gegebener Innenschleifenabschnitt 54, 55, 56, 57, 58 eine oder 50 
mehrere Rekonfigurationsanweisungen enthalten kann. Im allgeraeinen werden fur jedes gegebene Programm 
die AuBenschleifenabschnitte 52 oder das Programmlisting 50 eine Vielzahl von Allzweck-Instruktionstypen 
beinhalten, wahrend die Innenschleifenabschnitte 54, 56 des Programmlistings 50 aus relativ wenigen Instruk- 
tionstypen bestehen, die verwendet werden, urn einen spezifischen Satz von Operationen durchzufuhren. 

Bei dem beispielhaften Programmlisting 50 erscheint eine erste Rekonflgurationsanweisung am Begin n des 55 
ersten Innenschleifenabschnittes 54 und eine zweite Rekonflgurationsanweisung erscheint an dera Ende des 
ersten Innenschleifenabschnittes 54. In ahnlicher Weise erscheint eine dritte Rekonflgurationsanweisung am 
Beginn des zweiten Innenschleifenabschnittes 55; eine vierte Rekonfigurationsanweisung erscheint am Beginn 
des dritten Innenschleifenabschnittes 56; eine fQnJFte Rekonfigurationsanweisung erscheint am Beginn des vier- 
ten Innenschleifenabschnittes 57; und eine sechste und siebte Rekonfigurationsanweisung erscheint am Beginn eo 
und am Ende des funften Innenschleifenabschnittes 58, und zwar jeweilig. Jede Rekonfigurationsanweisung 
nimmt vorzugsweise auf einen Konfigurationsdatensatz Bezug, der eine interne DRPU-Hardware-Organisation 
spezifiziert, die auf die Implementation bzw. Realisation einer bestimmten Instruktionssatz-Architektur bzw. 
"Instruction Set Architect ure" (ISA) ausgerichtet ist und dafQr optimiert ist Eine ISA ist ein primitiver Satz oder 
Kernsatz von Instruktionen, der verwendet werden kann, urn einen Computer zu programmieren. Eine ISA 65 
definiert Instruktionsformate, Operationscodes bzw. Opcodes, Datenformate, Adressierungsmoden, Ausfuh- 
rungssteuermarken bzw. Ausfuhrungssteuerflags und fiber das Programm zugreifbare Register. Fachleute wer- 
den erkennen, daB dies der konventionellen Definition einer ISA entspricht. Bei der vorliegenden Erfindung 
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kann jede DRPU 32 einer S-Maschine schnell in Echtzeit konfigxiriert werden, urn direkt mehrere IS As durch die 
Verwendung eines einzigen Konftgurationsdatensatzes fur jede gewOnschte ISA zu realisieren. Das heiBt jede 
ISA wird mit einer einzigen internen DRPU- Hardware-Organisation realisiert bzw. impleraentiert wie dies 
durch einen entsprechenden Konflgurationsdatensatz spezifiziert ist So mit eatsprechen bei der vorliegenden 
5 Erfindung die ersten bis fQnften Innenschleif enabschnitte 54, 55, 56, 57, 58 jeweils einer einzigen ISA, namlich 
ISA jeweilig 1, 2, 3, 4 und k. Fachleute werden erkennen, daB jede auf einanderfolgende bzw. sukzessive ISA nicht 
einzig zu sein braucht Somit kann ISA k ISA 1, 2, 3, 4 oder jede davon unterschiedliche ISA sein. Der Satz von 
AuBenschletfenabschnitten 52 entspricht ebenso einer einzigen ISA, namlich ISA 0. Bei der bevorzugten AusfUh- 
rungsform kann wahrend der Programmausf uhrung die Auswahi sukzessiver Rekonfigurationsanweisungen von 

io den Daten abhangen. Nach der Auswahi einer gegebenen Rekonfigurationsanweisung werden die Programniin- 
struktionen aufeinanderfolgend gemaB einer entsprechenden ISA Qber eine einzige DRPU-Hardware-Konfigu- 
ration ausgefuhrt, wie dies durch einen entsprechenden Konflgurationsdatensatz spezifiziert ist. 

Bei der vorliegenden Erfindung kann eine gegebene ISA als eine Innenschleifen-ISA oder eine AuBenschlei- 
fen-ISA gemaB der Anzahl und Typen von Instruktionen, die sie enthalt kategorisiert werden. Eine ISA, die 

is mehrere Instruktionen beinhaltet und das ist nUtzlich, um Allzweck-Operationen durchzufuhren, ist eine AuBen- 
schleifen-ISA, wahrend eine ISA, die aus relativ wenigen Instruktionen besteht, und das ist daraufhin ausgerich- 
tet spezifische Typen von Operationen durchzufGhren, ist eine Innenschleifen-ISA. Weil eine AuBenschleifen- 
ISA auf die Durchfuhrung von Allzweck-Operationen gerichtet ist, ist eine AuBenschleifen-ISA besonders 
nutzlich, wenn eine aufeinander abfolgende bzw. sequentielle AusfQhrung von Program rainstruktionen er- 

20 wtinscht ist Die Leistungsfahigkeit einer AuBenschleifen-ISA bezUglich der Ausfuhrung wird vorzugsweise in 
Terra en der Taktzyklen pro ausgefuhrter Instruktion charakterisiert Im Gegensatz dazu ist eine Innenschleifen- 
ISA, da eine Innenschleifen-ISA auf die AusfQhrung spezieller Typen von Operationen gerichtet ist, am nutzlich- 
sten, wenn eine A us running von Parallei-Programminstruktionen wUnschenswert ist Die Leistungsfahigkeit 
einer Innenschleifen-ISA wird vorzugsweise in Termen von ausgefuhrten Instruktionen pro Taktzyklus oder 

25 Rechenergebnis, das pro Taktzyklus erzeugt wird, charakterisiert 

Fachleute werden erkennen, daB die vorhergehende Diskussion einer Ausfuhrung von sequentiellen Pro- 
gramminstruktionen und einer Ausfuhrung von parallelen Program mi nstruktionen die Ausfuhrung von Pro- 
gramminstruktionen innerhalb einer einzigen DRPU 32 betrifft Das Vorliegen von mehreren S-Maschinen 12 in 
dem System 10 erleichtert die parailele Ausfuhrung von mehreren Programminstruktionssequenzen zu jeder 

30 gegebenen Zeit und zwar wo jede Progranuninstruktionssequenz durch eine gegebene DRPU 32 ausgefuhrt 
wird. Jede DRPU 32 ist so konfiguriert, daB sie eine parailele bzw. serielle Hardware aufweist um eine 
bestimmte Innenschleifen-ISA bzw. AuBenschleifen-ISA zu einer bestimmten Zeit zu implementieren. Die 
interne Hardwarekonfigu ration einer gegebenen DRPU 32 andert sich mit der Zeit gemaB der Auswahi von 
einer oder mehreren Rekonfigurationsanweisungen, die innerhalb einer Sequenz von Programminstruktionen, 

35 die ausgefuhrt werden, eingebettet sind. 

Bei der bevorzugten Ausfuhrungsform werden jede ISA und ihre entsprechende interne DRPU-Hardware- 
Organisation ausgestaltet, um optimale Rechenleistungsfahigkeit fur eine bestimmte KJasse von Rechenproble- 
men relativ zu einem Satz von verfQgbaren rekonHgurierbaren Hardware-Systemeinheiten bereitzustellen. Wie 
zuvor erwShnt wurde und wie detaiilierter weiter unten beschrieben werden wird, wird eine interne DRPU- 

40 Hardware-Organisation, die einer AuBenschleifen-ISA entspricht vorzugsweise fur die AusfOhrung sequentiel- 
ler Programminstruktionen optimiert und eine interne DRPU-Hardware-Organisation, die einer Innenschleifen- 
ISA entspricht wird vorzugsweise fur eine Ausfuhrung paralleier Programminstruktionen optimiert Eine bei- 
spielhafte AlIzweck-AuBenschleifen-ISA ist Anhang A zu entnehmen und eine beispielhafte Innenschleifen-ISA* 
die auf die Faltung gerichtet ist ist dem Anhang B zu entnehmen. 

45 Mit Ausnahme jeder Rekonfigurationsanweisung, umfaBt das beispielhafte Programmlisting 50 der Fag. 3 A 
vorzugsweise herkdmmtiche Sprachbefehle hohen Niveaus, z.B, Befehle, die in Obereinstimmung mit der 
C-Programmiersprache beschrieben sind. Fachleute werden erkennen, daB der EinschluB.von einer oder mehre- 
ren Konfigurationsanweisungen in eine Sequenz von Programminstruktionen einen Kompiler erfordert der 
modifiziert ist bzw. geandert ist um den Rekonfigurationsanweisungen Rechnung zu tragen. Nimmt man nun auf 

50 die Fig. 3B Bezug, so ist ein FluBdiagramm nach dem Stand der Technik fQr Kompilierungsoperationen gezeigt 
die wahrend der Kompilierung einer Sequenz bzw. Abfolge von Prograrainiiistruktionen durchgefUhrt werden. 
Hierin entsprechen die Kompilierungsoperationen gemaB dem Stand der Technik im allgemeinen jenen, die 
durch den GNU-C-Kompiler (GCC) durchgefUhrt werden, der von der Free Software Foundation (Cambridge, 
MA, USA) hergestellt werdea Fachleute werden erkennen, daB die Kompilierungsoperationen gemaB dem 

55 Stand der Technik, die weiter unten beschrieben sind, leicht fur andere Kompiler veraUgemeinert werden 
kdnnen. Die Kompilierungsoperationen nach dem Stand der Technik beginnen im Schritt 500, wobei das 
Kompiler- Vorderende einen nachsten Befehl hohen Niveaus aus einer Abfolge von Programminstruktionen 
ausw&hlt Danach erzeugt das Kompiler- Vorderende einen Code mittleren Niveaus, der dem gewahlten Befehl 
hohen Niveaus im Schritt 502 entspricht was in dem Fall des GCC dem Registertransferniveau- bzw. "Register 

60 Transfer Level" (RTL) -Befehlen entspricht Folgt man nun Schritt 502, so bestimmt das Vorderende des 
KompUers, ob ein anderer Befehl hohen Niveaus im Schritt 504 eine Beachtung erfordert Falls dem so ist so 
kehrt das bevorzugte Verfahren zu dem Schritt 500 zurUck. 

Im Schritt 504 bestimmt das Kompfler-Vorderende, daB kein anderer Befehls hohen Niveaus eine Beachtung 
erfordert, das Kompiler- Hinterende fuhrt als nachstes herkommliche Registerzuweisungsoperationen im Schritt 

65 506 durch. Nach dem Schritt 506 wahlt das Kompiler-Hinterende einen nachsten RTL-Befehl, der innerhalb 
einer gegenwartigen RTL-Befehlsgruppe im Schritt 508 zu beachten ist Das Kompiler-Hinterende bestimmt 
dann, ob eine Regel im Schritt 510 existiert die eine Art und Weise spezifiziert, in der die gegenwartige 
RTL-Befehlsgruppe in einen Satz von Assemblersprachenbefehlen Ubersetzt werden kann. Falls eine derartige 
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. Regel nicht existiert, kehrt das bevorzugte Verfahren zum Schritt 508 zuruck, urn einen anderen RTL-Befehl 
auszuwahien, urn ihn in die gegenwartige RTL-Befehlsgruppe einzuschlieBen. Falls eine Regel existiert, die der 
gegenwartigen RTL-Befehlsgruppe entspricht erzeugt das Kornpiler-Hinterende einen Satz von Assembler- 
sprachenbefehien gemaB der Regel in dera Schritt 512. Nachfolgend zum Schritt 512 bestimrat das Kornpiler- 
Hinterende, ob ein nachster RTL-Befehl eine Beachtung erfordert und zwar im Zusammenhang mit einer 5 
nachsten RTL-Befehlsgruppe. Falls dera so ist kehrt das bevorzugte Verfahren zum Schritt 508 zuruck; anson- 
sten endet das bevorzugte Verfahren. 

Die vorliegende Erfindung beinhaltet vorzugsweise einen Kompiler fur dynamisch rekonfigurierbares Rech- 
nen- Niramt man nun Bezug auf die Fig. 3C und 3D, so ist ein FluBdiagramm fur bevorzugte Kompilierungsope- 
rationen gezeigt die von einem Kompiler fur eine dynamisch rekonfigurierbare Berechnung durchgefuhrt io 
werden. Die bevorzugten Kompilierungsoperationen beginnen beim Schritt 600 mit dern Vorderende des 
Kompilers fur dynamisch rekonfigurierbares Berechnen, wobei ein nachster Befehl hohen Niveaus innerhalb 
einer Sequenz von Programniinstruktionen ausgewahlt wird. Als nachstes bestimmt das Vorderende des Kompi- 
lers fur dynamisch rekonfigurierbares Berechnen, ob der gewahlte Befehl hohen Niveaus eine Rekonfigurations- 
anweisung ist, und zwar im Schritt 60Z Falls dera so ist, erzeugt das Vorderende des Kompilers fur dynamisch is 
rekonfigurierbares Rechnen einen RTL-Rekonfigurationsbefehl im Schritt 604, nachdem das bevorzugte Ver- 
fahren zu dem Schritt 600 zuruckkehrt Bei der bevorzugten Ausfuhrungsform handelt es sich bei dem RTL-Re- 
konfigurationsbefehl urn einen Nicht-Standard- RTL-Befehl, der eine ISA-Identifikation bzw. ISA-Kennzeich- 
nung beinhaltet Falls im Schritt 602 der gewahlte Programmbefehi hohen Niveaus nicht eine Rekonfigurations- 
anweisung ist, erzeugt das Vorderende des Kompilers fur dynamisch rekonfigurierbares Rechnen als nachstes 20 
einen Satz von RTL-Befehlen auf eine konventioneUe Art und Weise, und zwar im Schritt 606. Nach dem Schritt 
606 bestimmt das Vorderende des Kompilers fur dynamisch rekonfigurierbares Rechnen, ob ein anderer Befehl 
hohen Niveaus eine Beachtung erfordert, und zwar im Schritt 608. Falls dem so ist, kehrt das bevorzugte 
Verfahren zum Schritt 600 zuruck; ist dem nicht so, fahrt das bevorzugte Verfahren zu dem Schritt 610 fort, urn 
Operationen bezugiich des hinteren Endes auszuldsen bzw. zu beginnen. 25 

Im Schritt 610 ffihrt das Hinterende des Kompilers fur dynamisch rekonfigurierbares Rechnen Registerzuord- 
nungsoperationen durch. Bei der bevorzugten AusfQhrungsfonn der vorliegenden Erfindung ist jede ISA derar- 
tig definiert, daB die Registerarchitektur von einer [SA zu einer anderen konsistent ist; deshalb werden die 
Registerzuordnungsoperationen auf eine konventioneUe Art und Weise durchgefOhrt Fachleute werden erken- 
nen, daB im allgemeinen eine konsistente Registerarchitektur von einer ISA zur anderen kein absolutes Erfor- 30 
' dernis ist Als nachstes wlhlt das Hinterende des Kompilers fur dynamisch rekonfigurierbares Rechnen einen 
nachsten RTL-Befehl innerhalb einer gegenwartig betrachteten RTL-Befehlsgruppe im Schritt 612. Das Hinte- 
rende des Kompilers fQr dynamisch rekonfigurierbares Rechnen bestimmt dann im Schritt 614, ob der gewahlte 
RTL-Befehl eine RTL-Rekonfigurationsbefehl ist Falls der gewahlte RTL-Befehl kein RTL-Rekonfigurations- 
befehl ist, bestimmt das Hinterende des Kompilers far dynamisch rekonfigurierbares Rechnen im Schritt 618, ob 35 
eine Regel fQr die gegenwartig betrachtete RTL-Befehlsgruppe existiert Falls nicht kehrt das bevorzugte 
Verfahren zum Schritt 612 zurQck, urn einen nachsten RTL-Befehl auszuw&hlen, der in die gegenwartig betrach- 
tete RTL-Befehlsgruppe eingeschlossen werden solL FQr den Fall, daB eine Regel fur die gegenwartig betrachte- 
te RTL-Befehlsgruppe im Schritt 618 existiert, erzeugt das Hinterende des Kompilers fur dynamisch rekonfigu- 
rierbares Rechnen als nachstes einen Satz von Assemblersprachbefehlen, die der gegenwartig betrachteten 40 
RTL-Befehlsgruppe gemaB dieser Regel entspricht, und zwar im Schritt 62a Nachfolgend zum Schritt 620 
bestimmt das Hinterende des Kompilers fQr dynamisch rekonfigurierbares Rechnen, ob ein anderer RTL-Befehl 
eine Beachtung innerhalb des Zusammenhangs einer nachsten RTL-Befehlsgruppe erfordert, und zwar im 
Schritt 622. Falls dem so ist, kehrt das bevorzugte Verfahren zum Schritt 612 zurfick, falls dem nicht so ist, endet 
das b evorzugte Verf ahrea 45 

Im Schritt 614 handelt es sich bei dem gewahlten RTL-Befehl um einen RTL-Rekonfigurationsbefehl, das 
Hinterende des Kompilers fur dynamisch rekonfigurierbares Rechnen wahlt einen Regelsatz, der der ISA-Iden- 
tifikation innerhalb des RTL-Rekonfigurationsbefehls entspricht und zwar im Schritt 616. Bei der vorliegenden 
Erfindung existiert vorzugsweise ein einziger Regelsatz fQr jede ISA. Jeder Regelsatz lief ert deshalb eine oder 
mehrere Regeln zur Umwandlung von Gruppen von RTL-Befehlen in Assemblersprachbefehle in Obereinstim- 50 
mung mit einer bestimmten ISA. Nachfolgend zum Schritt 616 lauft das bevorzugte Verfahren weiter zum 
Schritt 618. Der Regelsatz, der einer jeden gegebenen ISA entspricht beinhaltet vorzugsweise eine Regel, um 
den RTL-Rekonfigurationsbefehl in einen Satz von Assemblersprachbefehlen zu Qbersetzen, die einen Softwa- 
re-Interrupt erzeugen, der in der Ausfuhrung einer Rekonfigurations-Handhabungseinrichtung resultiert, wie 
dies im folgenden detailliert beschrieben werden wird. 55 

In der oben beschriebenen Art und Weise erzeugt der Kompiler fur dynamisch rekonfigurierbares Rechnen 
selektiv und automatisch Assemblersprachbefehle, und zwar in Obereinstiramung mit mehreren ISAs wahrend 
der Kompilierungsoperationen. Mit anderen Worten kompiliert wahrend des Kompilierungsprozesses der 
Kompiler fur dynamisch rekonfigurierbares Rechnen einen einzigen Satz von Programminstruktionen gemaB 
einer variablen ISA. Bei dem Kompiler fur dynamisch rekonfigurierbares Rechnen handelt es sich vorzugsweise eo 
um einen herkommlichen Kompiler, der modifiziert ist um die bevorzugten Kompilierungsoperationen durch- 
zufuhren, die oben unter Bezugnahme auf die Fig. 3C und 3D beschrieben sind. Fachleute werden erkennen, daB, 
obwohl die erforderlichen Modifikationen bzw. Anderungen nicht komplex sind, derartige Modiftkationen im 
Hinblick auf sowohl Kompilierungstechniken nach dem Stand der Technik als auch rekonfigurierbare Rechen- 
techniken nach dem Stand der Technik nicht offensichdich sind. 65 

Nimrat man nun Bezug auf die Fig. 4, so ist ein Blockschaltbild bzw. ein BEockdiagramm einer bevorzugten 
Ausfuhrungsform einer dynamischen rekonfigurierbaren Verarbeirungseinheit 32 gezeigt Die DRPU 32 umfaBt 
eine Instniktionsanforderungseinheit (IFU) 60, eine Datenoperationseinheit (DOU) 62 und eine Adressenopera- 
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tionseinheit (AOU) 64. Sowohl die IFU GO als auch die DOU 62 und die AOU 64 umfassen einen Zeitsteuerein- 
gang, der mit der ersten Zeitsteuersignal!eitung 40 verbunden ist Die IFU 60 umfaSt einen Speichersteueraus- 
gang, der mit der Speichersteuerleitung 42 verbunden ist, einen Dateneingang, der mit der speicher-I/O-Leitung 
46 verbunden ist, und einen bidirektionalen Steuerport, der mit der externen Steuerieitung 48 verbunden ist Die 
5 IFU 60 umfaBt zusatzlich einen ersten Steuerausgang, der mit einera ersten Steuereingang der DOU 62 uber eine 
erste Steuerieitung 70 verbunden ist, und einen zweiten Steuerausgang, der rait einera ersten Steuereingang der 
AOU 64 uber eine zweite Steuerieitung 72 verbunden ist Die IFU 60 umfaBt ebenso einen dritten Steueraus- 
gang, der mit einem zweiten Steuereingang der DOU 62 und einem zweiten Steuereingang der AOU 64 uber 
eine dritte Steuerieitung 74 verbunden ist Die DOU 62 und die AOU 64 umfassen jeweils einen bidirektionalen 

io Datenport, der mit der speicher-I/O-Leitung 46 verbunden ist SchlieBIich umfaBt die AOU 64 einen Adressen- 
ausgang, der den Adressenausgang der DRPU ausbildet 

Die DRPU 32 wird vorzugsweise realisiert, indem eine rekonfigurierbare oder reprogrammierbare Logikvor- 
richtuna wie z. B. eine FPGA, wie z. B. eine Xilinx XC4013 (Xilinx, Inc, San Jose, CA, USA) oder eine AT&T 
ORCA™ 1C07 (AT&T Microelectronics, Allentown, PA, USA) verwendet wird. Vorzugsweise stellt die repro- 

15 graznmierbare Logikvonichtung eine Vielzahl von folgendem bereit: 1) selektiv reprogrammierbare Logikblok- 
ke oder konfigurierbare Logikblocke (CLBs); 2) selektiv reprogrammierbare I/O-Bldcke (lOBs); 3) selektiv 
reprogrammierbare Verbindungsstrukturen; 4) Datenspeicher-Systemeinheiten; 5) Dreizustands-Puffer-Sy- 
stemeinheiten; und 6) Funktionsfahigkeiten einer fest verdrahteten Logik. Jede CLB beinhaltet vorzugsweise 
eine selektiv rekonfigurierbare Schaltung zur Erzeugung von Logikfunktionen, Speicherdaten und Wegeermitt- 

20 lungssignalen bzw. Leitwegsignalen. Fachleute werden erkennen, daB eine rekonfigurierbare Datenspeicher- 
schaltung auch in einer oder mehreren Datenspeicherblocken (DSBs) beinhaltet sein kdnnen, die von dem Satz 
von CLBs getrennt sind, und zwar in Abhangigkeit von der exakten Ausgestaltung der rekonfigurierbaren 
Logikvorrichtung, die verwendet wird. Hier befindet sich die rekonfigurierbare Datenspeicherschaltung, die 
innerhalb einer FPGA ist, innerhalb der CLBs; d h. die Gegenwart von DSBs wind nicht angenommen. Fachleute 

25 werden leicht erkennen, daB eine oder mehrere Elemente, die hierin beschrieben sind, die eine CLB-basierte 
rekonfigurierbare Datenspeicherschaltung verwenden, eine DSB-basierte Schaltung fur den Fall verwenden 
kdnnten, daB DSBs vorhanden sind. Jede IOB beinhaltet vorzugsweise eine selektiv rekonfigurierbare Schaltung, 
urn Daten zwischen CLBs und einem FPGA- Ausgangspin zu Qbertragen. Ein Konfigurationsdatensatz legt eine 
D RPU- Hard ware - Konfiguration oder -Organisation fest, indem Funktionen spezifiziert werden, die innerhalb 

30 von CLBs durchgefuhrt werden, sowie Verbindungen spezifiziert werden, und zwar wie folgt: 1) innerhalb CLBs; 
2) zwischen CLBs; 3) innerhalb IOBs; 4) zwischen lOBs; und 5) zwischen CLBs und IOBs. Fachleute werden 
erkennen, daB uber einen Konfigurationsdatensatz die Anzahl von Bits sowohl in der Speichersteuerleitung 42 
als auch in der AdreBleitung 44, der speicher-I/O-Leitung 46 und der externen Steuerieitung 48 rekonfigurierbar 
ist Vorzugsweise werden Konfigurationsdatensatze in einem oder mehreren S-Maschinenspeichern 34 inner- 

35 halb des Systems 10 gespeichert Fachleute werden erkennen, daB die DRPU 32 nicht auf eine FPGA-basierte 
Implementation bzw. Realisierung beschrankt ist Zum Beispiel kdnnte die DRPU 32 als eine RAM-basierte 
Zustandsmaschine verwirklicht werden, die moglicherweise eine oder mehrere Nachschlag- bzw. Verweistabel- 
len enthaJt Altemativ kdnnte die DRPU 32 realisiert werden, indem eine komplex programmierbare Logikvor- 
richtung bzw. eine "Complex Programmable Logic Device" (CPLD) verwendet wird, Jedoch werden Fachleute 

40 erkennen, daB einige der S- Maschinen 1 2 des Systems 10 DRPUs 32 enthalten kdnnen, die nicht rekonfigurierbar 
sind. 

Bei der bevorzugten Ausfuhrungsform sind sowohl die IFU 60 als auch die DOU 62 und die AOU 64 
dynamisch rekonfigurierbar. So mit kann ihre interne Hardware-IConfiguration selektiv wahrend der Programm- 
ausfuhrung geandert werden. Die IFU 60 verwaltet Instruktionsanweisungs- und Decodieroperationen, Spei- 

45 cherzugriffsoperationen, DRPU-Rekonfigurationsoperationen und gibt Steuersignale zu der DOU 62 und der 
AOU 64 aus, urn die InstruktionsausGbung zu erleichtem. Die DOU 62 fuhrt Operadonen aus, die eine Datenbe- 
rechnung mit einschlieBen bzw. mit sich bringen und die AOU 64 fuhrt Operationen aus, die eine Adressenbe- 
rechnung mit sich bringen. Die interne Struktur und der Betrieb sowohl der IFU 60 als auch der DOU 62 und der 
AOU 64 wird nun detailliert beschrieben. 

50 Nimmt man Bezug auf die Fig. 5, so ist ein Blockdiagramm bzw. ein Blockschaltbild einer bevorzugten 
AusfQhrungsform der Instruktionsabrufeinheit 60 bzw. "Instruction Fetch Unit" 60 gezeigt Die IFU 60 umfaBt 
eine Instruktionszustandsfolgesteuereinheit bzw. einen "Instruction State Sequencer* (ISS) 100, einen Architek- 
turbeschreibungsspeicher 101, eine Speicherzugriffslogik 102, eine Rekonfiguratiotisiogik 104, eine Intermptlo- 
gik 106, eine Abrufsteuereinheit 108, einen Instruktionspuffer 1 10, eine Dekodersteuereinheit 112, einen Instruk- 

55 tionsdeooder 114, einen Operationscode-Speicherregistersatz 116, einen Registerfite (RF)-Adressenregistersatz 
118, einen Konstantenregistersatz 120 und einen ProzeBsteuerregistersatz 122. Die ISS 100 umfaBt einen ersten 
bzw. einen zweiten Steuerausgang, der den ersten bzw. zweiten Steuerausgang der IFU ausbildet, und einen 
Zeitsteuereingang, der den Zeitsteuereingang der IFU ausbildet Die ISS 100 umfaBt ebenso einen Abruf-/Deco- 
dersteuerausgang, der mit einem Steuereingang der Abrufsteuereinheit 108 und einem Steuereingang der 

60 Decodiersteuereinheit 1 12 Ober eine Abruf-/Decodiersteuerleitung 130 verbunden ist Die ISS 100 weist zusatz- 
lich einen bidirektionalen Steuerport auf, der mit einem ersten bidirektionalen Steuerport sowohl der Speicher- 
zugriffslogik 102 als auch der Rekonfigurationslogik 104 und der Interruptlogik 106 uber eine bidirektionale 
Steuerieitung 132 verbunden ist Die ISS 100 umfaBt ebenso einen Operationscodeeingang, der mit einem 
Ausgang des Operationscodespeicherregistersatzes 116 uber eine Operationscodeleitung 142 verbunden ist 

55 SchlieBIich umfaBt die ISS 100 einen bidirektionalen Datenport, der mit einem bidirektionalen Datenport des 
ProzeBsteuerregist ersatzes 122 uber eine ProzeBdatenleitung 144 verbunden ist 

Sowohl die Speicherzugriffslogik 102 als auch die Rekonfigurationslogik 104 und die Interruptlogik 106 
umfassen einen zweiten bidirektionalen Steuerport, der mit der externen Steuerieitung 48 verbunden ist Die 
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Speicherzugriffslogik 102, die Rekonfigurationslogik 104 und die Interruptlogik 106 umfassen zusatzlich jewefls 
einen Dateneingang, der mit einem Datenausgang des Architekturbeschreibungsspeichers 101 fiber eine Imple- 
mentationssteuerieitung 131 bzw. Realisierungssteuerleitung 131 verbunden ist Die Speicherzugriffslogik 102 
umfaBt zusatzlich einen Steuerausgang, der den Speichersteuerausgang der IFU ausbildet Und die Interruptlo- 
gik 106 um/aBt einen Ausgang, der mit der ProzeBdatenleitung 144 verbunden ist Der Instruktionspuf fer 110 5 
umfaBt einen Dateneingang, der den Dateneingang der IFU ausbildet, einen Steuereingang, der mit einem 
Steuerausgang der Abrufsteuereinheit 108 uber eine Abrufsteuerleitimg 134 verbunden ist, und einen Ausgang, 
der mit einem Eingang des Instruktionsdecoders 114 uber eine Instruktionsleitung 136 verbunden ist Der 
Instruktionsdecoder 114 umfafit einen Steuereingang, der mit einem Steuerausgang der Decodiersteuereinheit 
112 fiber eine Decodiersteuerleitung 138 verbunden ist, und einen Ausgang, der uber eine Decodierinstruktions- 10 
leitung 140 mit 1) einem Eingang des Operationscode-Speicherregistersatzes 116; 2) einem Eingang des RF- 
Adressenregistersatzes 118; und 3) einem Eingang des Konstantenregistersatzes 120 verbunden ist Der RF- 
Adressenregistersatz 118 und der Konstantenregistersatz 120 umfassen jeweils einen Ausgang, die zusammen 
den dritten Steuerausgang 74 der IFU ausbilden. 

Der Architekturbescfareibungsspeicher 101 speichert Architekturbeschreibungssignale, die die gegenwartige 15 
DRPU-Konfiguration kennzeichnen. Vorzugsweise beinhalten die Architekturspezifikationssignale 1) einen 
Bezug bzw. eine Referenz zu einem Ausgangskonfigurationsdatensatz bzw. Defadt-Konfigurationsdatensatz; 2) 
einen Bezug bzw. eine Referenz zu einer Liste von moglichen Konfigurationsdatensatzen; 3) einen Bezug bzw. 
eine Referenz zu einem Konfigurationsdatensatz, der der gegenwartig betrachteten ISA entspricht, d. h. einen 
Bezug zu dem Konfigurationsdatensatz, der die gegenwartige DRPU-Konfiguration festlegt; 4) eine Verbin- 20 
dungsadressenliste, die eine oder mehrere Verbindungs-I/O-Einheiten 304 innerhalb der T-Maschine 14 identifi- 
ziert, die der S-Maschine 12 zugeordnet ist, in der sich die IFU 60 befindet, wie detailliert weiter unten unter 
Bezugnahme auf die Fig. 13 beschrieben werden wird; 5) einen Satz von Intemipt-Antwortsignalen, die eine 
Interruptsuchzeit bzw. Intemiptverzdgerungszeit und eine Interrupt- Prazisions information, die festlegt, wie die 
IFU 60 auf die Interrupt antwortet, spezifizieren; und 6) eine Speicherzugriffskonstante, die eine atomare 25 
Speicheradresseninkrementierung festlegt Bei der bevorzugten Ausfuhrungsform realisiert bzw. implementiert 
jeder Konflgurationsdatensat z den Architekturbeschreibungsspeicher 101 als einen Satz von CLBs, der als ein 
Nur-Lese-Speicher bzw. "Read Only Memory* (ROM) konfiguriert ist Die Arcfaitekturspezifikationssignale, die 
den Inhalt des Architekrurbeschreibungsspeichers 101 festlegen, sind vorzugsweise in jedem Konfiguradonsda- 
tensatz enthalten. Da jeder Konfigurationsdatensatz einer bestimmten ISA entspricht, variiert der Inhalt des 30 
Architekturbeschreibungsspeichers 101 gemaB der ISA, die gegenwartig betrachtet wird. Fur eine gegebene 
ISA wird der Programrazugriff auf den Inhalt des Architekturbeschreibungsspeichers 101 vorzugsweise erleich- 
tert, indem eine Speicherleseinstruktion in die ISA eingeschlossen wird bzw. mit aufgenommen wird. Dies 
ermoglicht es, daB ein Programm Informationen fiber die gegenwartige DRPU-Konfiguration wahrend der 
Programraaus fanning wiederfindet 35 

Bei der vorliegenden Erfindung handelt es sich bei der Rekonfigurationslogik 104 urn eine Zustandsmaschine, 
die eine Abfolge von Rekonfigurationsoperationen steuert, die die Rekonfiguration der DRPU32 gemaB einem 
Konfigurationsdatensatz erleichtert Vorzugsweise last die Rekonfigurationslogik 104 die Rekonfigurationsope- 
rationen nach dem Empfang eines Rekonfigurationssignals aus. Wie detailierter weiter unten beschrieben 
werden wird, wird das Rekonfigurationssignal durch die Intemiptlogik 106 in Antwort auf einen Rekonfigura- 40 
tions interrupt erzeugt, der auf der externen Steuerleitung 48 empfangen wird, oder es wird durch die ISS 100 in 
Antwort auf eine Rekonfigurationsanweisung, die in einem Programm eingebaut ist, erzeugt Die Rekonfigura- 
tionsoperationen stellen eine anfangliche DRPU-Konfiguration bereit, die einer Einschalt-ZReset-Bedingung 
folgt, die den Ausgangs-Konfigurationsdatensatz bzw. Default-Konfigurationsdatensatz verwendet, auf den der 
Architekturbeschreibungsspeicher 101 verweist Die Rekonfigurationsoperationen stellen ebenso eine selektive 45 
DRPU-Rekonfiguration bereit, nachdem die anfanghche DRPU-Konfiguration erstellt worden ist Nach der 
Vollendung der Rekonfigurationsoperationen gibt die Rekonfigurationslogik 104 ein Vollendungssignal ab. Bei 
der bevorzugten Ausfuhrungsform handelt es sich bei der Rekonfigurationslogik 104 urn eine nicht-rekonfigu- 
rierbare Logik, die das Laden von Konfigurationsdatensatzen in die reprogrammierbare Logikvorrichtung 
selbst steuert, und somit wird die Abfolge bzw. Sequenz von Rekonfigurationsoperationen durch den Hersteller so 
der reprogrammierbaren Logikvorrichtung festgelegt Die Rekonfigurationsoperationen werden nun fur die 
Fachleute bekannt sein. 

Jede DRPU-Konfiguration ist vorzugsweise durch einen Konfigurationsdatensatz gegeben, der eine bestimm- 
te Hardware-Organisation festlegt, die auf die Implementation bzw. Realisierung einer entsprechenden ISA 
ausgerichtet ist bzw. zugeordnet ist Bei der bevorzugten AusfOhrungsform beinhaltet die IFU 60 jedes der 55 
Elemente, auf die oben hingewiesen wurde, und zwar unabhangig von der DRPU-Konfiguration. Bei einem 
Basisniveau bzw. bei einer Grundebene ist die Funktionalitat bzw. Funktionstuchtigkeit, die durch jedes Element 
innerhalb der IFU 60 bereitgestellt wird, unabhangig von der gegenwartig betrachteten ISA. Jedoch kann bei der 
bevorzugten Ausfuhrungsform die detaiilierte Struktur und Funktionstfichtigkeit von einem oder mehreren 
Elementen der IFU 60 sich verandern, und zwar aufgrund der Natur der ISA fur die sie konfiguriert worden ist 60 
Bei der bevorzugten Ausfuhrungsform bleibt die Struktur und Funktionalitat des Architekturbeschreibungsspei- 
chers 101 und der Rekonfigurationslogik 104 vorzugsweise von einer DRPU-Konfiguration zu einer anderen 
konstant Die Struktur und Funktionstuchtigkeit bzw. Funktionalitat der anderen Elemente der IFU 60 und die 
Art und Weise, in der sie gema\3 dem Typ der ISA variieren, wird nun im Detail beschrieben. 

Der ProzeBsteuerregistersatz 122 speichert Signale und Daten, die durch die ISS 100 wahrend der Ausf Ohrung 65 
von Instruktionen verwendet wird. Bei der bevorzugten Ausfuhrungsform umfafit der ProzeBsteuerregistersatz 
122 ein Register, um ein ProzeBsteuerwort zu speichem, ein Register, urn einen Interruptvektor zu speichern, 
und ein Register, um einen Bezug zu einem Konfigurationsdatensatz zu speichern. Das ProzeBsteuerwort 
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beinhaltet vorzugsweise eine Vielzahl von Bedingungsflags, die wahlweise gesetzt und rttckgesetzt werden 
kdnnen, und zwar in Abhangigkeit von Bedingungen, die wahrend der Instmktionsausfuhrung auftreten. Das 
ProzeBsteuerwort beinhaltet zusatzlich eine Vielzahl von Obergangssteuersignalen, die eine oder mehrere 
Arten und Weisen festlegen, in denen Interrupts abgearbeitet werden kdnnen, wie im folgenden detaiiiierter 
5 beschrieben werden wird Bei der bevorzugten Ausfiihrungsform ist der ProzeBsteuerregistersatz 122 als ein 
Satz von CLBs realisiert, der fur Datenspeicherung und fur Gattersteuerlogik bzw. logische Torschaltungen 
konfiguriert ist 

Die ISS 100 ist vorzugsweise eine Zustandsmaschine, die den Be trie b der Abrufsteuereinheit 108, der Deco- 
diersteuereinheit 112, der DOU 62 und der AOU 64 steuert und Speicherlese- und Speicherschreibsignale zu der 

io Speicherzugriffslogik 102 ausgibt, urn die Instmktionsausfuhrung zu erleichtern. Nimmt man nun Bezug auf 
Fig. 6, so ist ein Zustandsdiagramm gezeigt, das einen bevorzugten Satz von Zustanden, die durch die ISS 100 
unterstdtzt werden, zeigt Nachfolgend zu einer Einschalt- oder Resetbedingung oder unmittelbar, nachdera eine 
Rekonfiguration aufgetreten ist, beginnt die ISS 100 mit einer Operation im Zustand P. En Antwort auf das 
VoUendungssignal, das durch die Rekonfigurationslogik 104 ausgegeben wird, schreitet die ISS 100 zum Zustand 

15 S fort, indem die ISS 100 Programmzustandsinformattonen initialisiert wiederhergestellt, und zwar in dem Fall, 
daB eine Einschalt-/Resetbedingung bzw. eine Rekonfiguration aufgetreten ist Die ISS 100 schreitet zum 
Zustand F fort, indem Instruktionsabrufoperationen durchgefuhrt werden. Bei den Instruktionsabrufoperatio- 
nen gibt die ISS 100 ein Speicherlesesignal zu der Speicherzugriffslogik 102 aus, gibt ein Abrufsignal zu der 
Abrufsteuereinheit 108 aus und gibt ein Inkrementsignal zu der AOU 64 aus, urn ein Programmadressenregister 

20 bezuglich einer nachsten Instruktion bzw. ein "Next Instruction Programm Address Register" (NIPAR) 232 zu 
inkrementieren, wie unten detaiiiierter unter Bezugnahme auf die Fig. 1 1A und 1 IB beschrieben wird Nach dem 
Zustand F schreitet die ISS 100 zu dem Zustand D, urn Instruktionsdecodieroperadonen auszuldsen. Im Zustand 
D gibt die ISS 100 ein Decodiersignal zu der Decodiersteuereinheit 112 aus. Wahrend sie im Zustand D ist, liest 
die ISS 100 zusatzlich einen Operationscode aus, und zwar entsprechend einer decodierten Instruktion von dem 

25 Operationscodespeicherregistersatz 1 1& Basierend auf dem empfangenen Operationscode, schreitet die ISS 100 
zu dem Zustand E oder zu dem Zustand M fort, urn Instruktionsausfahrungsoperationen durchzufuhren. Die ISS 
100 schreitet zu dem Zustand E in dem Fall fort, daB die Instruktion in einem einzigen Taktzyklus ausgeftthrt 
werden kann; andernfalls schreitet die ISS 100 zu dem Zustand M fQr Multizyklusmstniktionsausfulirung fort 
Bei den InstniktionsausfOhrungsoperationen erzeugt die ISS 100 DOU-Steuersignale, AOU-Steuersignale und/ 

30 oder Signale, die auf die Speicherzugriffslogik 102 gerichtet sind, urn die Ausfahrung der Instruktionen zu 
erleichtern, die dem wiedergewonnenen bzw. ausgelesenen Operationscode entsprechea Nachfolgend entwe- 
der den Zustanden E oder M, schreitet die ISS 100 zu dem Zustand W fort Im Zustand W erzeugt die ISS 100 
DOU-Steuersignale, AOU-Steuersignale und/oder Speicherschreibsignale, um ein Speichern eines Ergebnisses 
einer Instruktionsausfuhrung zu erleichtern. Auf dem Zustand W wird deshalb als ein Schreib-zurGck-Zustand 

35 Bezug genommen. 

Fachleute werden erkennen, daB die Zustande F, D, E oder M und W einen vollstandigen Instruktionsausf Uh- 
rungszyklus aufweisen. Nach dem Zustand W schreitet die ISS 100 zu dem Zustand Y in dem Fall fort, daB ein 
Aussetzen einer Instruktionsausfuhrung erforderlich ist Der Zustand Y entspricht einem nichttfitigen Zustand 
bzw. Ruhezustand, der z. B. in dem Fall erforderlich sein kann, daB eine T-Maschine 14 Zugriff zu dem S-Mascht- 

40 nenspeicher 34 fordert bzw. bendtigt Nachfolgend zum Zustand Y oder nach dem Zustand W kehrt die ISS 100 
in dem Fall, daB die Instruktionsausfuhrung fortgesetzt werden soil, zu dem Zustand F zuriick, um einen anderen 
InstruktionsausfQhrungszyklus aufzunehmen. 

Wie in Fig. 6 gezeigt, beinhaltet das Zustandsdiagramm ebenso einen Zustand I, der festgelegt ist, ein 
Interruptservicezustand zu sein. Bei der voiiiegenden Erfmdung empfangt die ISS 100 ein Interruptmeldungssi- 

45 gnal von der Interruptlogik 106. Wie im folgenden unter Bezugnahme auf die Fig. 7 beschrieben werden wird, 
erzeugt die Interruptlogik 106 Obergangssteuersignale und speichert die Obergangssteuersignale in dem Pro- 
zeBsteuerwort innerhalb des ProzeBsteuerregistersatzes 122. Die Obergangssteuersignale weisen vorzugsweise 
darauf bin, welcher der Zustande F, D, E, M, W und Y unterbrechbar sind bzw. auf ein Interrupt reagieren, und 
auf ein Niveau bzw. eine Ebene einer Interruptprazision, die in bzw. bei jedera unterbrechbaren Zustand 

so erforderlich ist, und fur jeden unterbrechbaren Zustand auf einen nsLchster Zustand, bei dem die Instruktionsaus- 
fuhrung fortgesetzt werden soli und der dem Zustand I folgt Falls die ISS 100 ein Interruptmeldungssignal 
empfangt, wahrend sie in einem gegebenen Zustand ist, schreitet die ISS 100 zu dem Zustand I, falls das 
Obergangssteuersignal anzeigt, daB der gegenwartige Zustand unterbrechbar ist bzw. auf ein Interrupt anspre- 
chen kann. Andernfalls schreitet die ISS 100 fort als ob sie kein Interruptsignal empfangen hatte, bis sie einen 

55 unterbrechbaren Zustand erreicht 

Wenn einmal die ISS 100 zum Zustand I fortgeschritten ist, greift die ISS 100 vorzugsweise auf den ProzeB- 
steuerregistersatz 122 zu, um ein Interruptmaskierflag bzw. eine Interruptmaskierraarke zu setzen, und sie 
empfangt einen Interruptvektor. Nachdera der Interruptvektor wiedergewonnen bzw. ausgelesen ist, arbeitet 
die ISS 100 vorzugsweise Qber einen herkdmmlichen Subroutinensprung zu einer Intemipthandhabungseinrich- 

60 tung bzw. zu einem Interrupthandler, wie es durch den Interruptvektor beschrieben ist, den gegenwartigen 
Interrupt ab. 

Bei der vorliegenden Erfindung wird die Rekonfiguration der DRPU 32 in Antwort auf folgendes ausgeldst: 1) 
einen Rekonfigurationsinterrupt, der auf der externen Steuerleitung 48 akdv ist; oder 2) die AusfQhrung einer 
Rekonfigurationsanweisung innerhalb einer Abfolge von Programminstruktionen. Bei der bevorzugten Ausfuh- 
65 rungsform fuhren sowohl der Rekonfigurationsinterrupt als auch die Ausfahrung einer Rekonfigurationsanwei- 
sung zu einem Subroutinensprung zu einer Rekonfigurationshandhabungseinrichtung bzw. zu einem Rekonfigu- 
rationshandler. Vorzugsweise speichert die Rekonflgurationshandhabungseinrichtung Programmzustandsinfor- 
mationen und gibt eine Konfigurationsdatensatzadresse und das Rekonfigurationssignal zu der Rekonfigura- 
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tiooslogik 104. 

In dem FaH daB es sich bei dem voriiegenden latemipt nicht urn einen Rekonfigurationsinterrupt handelt 
schreitet die ISS 100 zu dem nachsten Zustand fort, wie dies durch die Obergangssteuersignale angezeigt wird, 
wenn der Interrupt empfangen worden ist wodurch ein Iiismiktionsausfuhrungszyklus wieder aufgenommen, 
vollendet oder ausgelast wird s 

Bei der bevorzugten Aiisfuhrungsforra variiert der Satz an Zustanden, der durch die ISS 100 unterstutzt wird, 
geraaS der Natur der ISA, fur die die DRPU 32 konfiguriert ist. Somit wiirde der Zustand M fur eine ISA nicht 
voriiegen, in der eine oder mehrere Instruktionen in ein em einzigen Taktzyklus ausgefuhrt werden kdnnen, was 
der Fall ware bei einer typischen Innenschleifen-ISA Wie gezeigt definiert das Zustandsdiagramni der Fig. 6 
vorzugsweise die Zustande, die durch die ISS 100 festgelegt werden, urn eine Allzweck-AuBenschleifen-ISA zu 10 
realisieren, Zur Realisierung der Innenschleifen-ISA unterstutzt die ISS 100 vorzugsweise mehrere Satze von 
Zustanden F, D, E und W, und zwar parallel, wodurch eine pipelineartige Steuerung einer Instrukttonsausfuh- 
rung in einer Art und Weise erleichtert wird, die leicht von Fachleuten verstanden wird Bei der bevorzugten 
Ausfuhrungsfonn ist die ISS 100 als eine CLB-basierte Zustandsmaschine realisiert die die Zustande oder einen 
Untersatz von den Zustanden, die oben beschrieben wurden, in Obereinstimmung mit der gegenwartig betrach- is 
teten ISA unterstQtzt 

Die Intemiptlogik 106 umfafit vorzugsweise eine Zustandsmaschine, die Obergangssteuersignale erzeugt und 
Interruptmeldeoperationen in Antwort auf ein Interruptsignal durchfQhrt das uber die externe Steuerleitung 48 
empfangen wird Nimmt man Bezug auf Fig. 7, so ist ein Zustandsdiagramm gezeigt das einen bevorzugten Satz 
von Zustanden zeigt, die durch die Intemiptlogik 106 unterstutzt werden. Die Intemiptlogik 106 beginnt ihren 20 
Betrieb bzw. ihre Operation im Zustand P. Der Zustand P entspricht einer EinschaJt-, Reset- oder Rekonfigura- 
tionsbedingung. In Antwort auf das Vollendungssignal, das durch die Rekonfigurationslogik 104 abgegeben wird, 
schreitet die Intemiptlogik 106 zum Zustand A und liest das Interruptantwortsignal a us dem Architekturbe- 
schreibungsspeicher 101. Die Intemiptlogik 106 erzeugt dann das Obergangssteuersignal aus den Interruptant- 
wortsignalen und speichert das Obergangssteuersignal in dem ProzeBsteuerregistersatz 12Z Bei der bevorzug- 25 
ten Ausfuhrungsfonn beinhaltet die Intemiptlogik 106 ein CLB-basiertes program rnierbares Logikfeld bzw. 
eine CLB-basierte "Programmable Logic Array* (PL-AX um die Interruptantwortsignale zu empfangen und urn • 
die Obergangssteuersignale zu erzeugen. Kachfolgend zum Zustand A schreitet die Interrupdogik 106 zu dem 
Zustand B fort, um auf ein Interruptsignal zu warten. Nach dem Empfang etnes Interruptsignals schreitet die 
Interrupdogik 106 zu dem Zustand C in dem Fall fort, daB das Interniptmaskierflag innerhalb des ProzeBsteuer- 30 
* registersatzes 122 zuruckgesetzt wird Wenn einmal der Zustand C erreicht ist bzw. voriiegt, besttmmt die 
Interrupdogik 106 den Ursprung des Interrupts, eine Interruptprioritat und eine Adresjse der Interrupthandha- 
bungseinrichtung bzw. eine Interrupthandleradresse. In dem Fall daB das Interruptsignal ein Rekonfigurations- 
interrupt ist, schreitet die Interrupdogik 106 zu dem Zustand R und speichert eine Konfiguradonsdatensatz- 
adresse in dem ProzeBsteuerregistersatz 122. Nach dem Zustand R oder nachfolgend zu dem Zustand C schreitet 35 
die Intemiptlogik 106, in dem Fall, daB das Interruptsignal nicht ein Rekonfigurationsinterrupt ist, zu dem 
Zustand N fort und speichert die Interrupthandleradresse bzw. die Adresse der Intermpthandhabungseinrich- 
tung in dem ProzeBsteuerregistersatz 122. Die Interrupdogik 106 schreitet als nachstes zu dem Zustand X und 
gibt ein Interruptroeldesignal zu der ISS 100. Nachfolgend zu dem Zustand X kehrt die Intemiptlogik 122 zum 
Zustand B zurfick, um auf ein nachstes Interruptsignal zu waren, "40 

Bei der bevorzugten Ausfuhrungsfonn variiert der Pegel bzw. die Ebene der Interruptwartezeit bzw. der 
Interruptverzdgerungszeit, wie sie durch die Interruptantwortsignale und folglich durch die Obergangssteuersi- 
gnale spezifiziert ist, in Abhangigkeit von der gegenwirtigen ISA, fQr die die DRPU 32 konfiguriert worden ist 
Zum Beispiel erfordert eine ISA, die auf Hochleistungs-Echtzeitbewegungssteuerung ausgerichtet ist, schnelle 
und vorhersehbare Interruptantwortfahigkeiten, Der Konfigurationsdatensatz, der einer derartigen ISA ent- 45 
spricht beinhaltet deshalb vorzugsweise Interruptantwortsignale, die anzeigen, daB eine Unterbrechung mit 
geringer Wartezeit bzw. Verzogerungszeit erforderlich ist Die entsprechenden Obergangssteuersignale identi- 
fizieren wiederum mehrere ISS-Zustande als unterbrechbar, wodurch es einem Interrupt ermdgticht wird, einen 
Insti^tionsausfuhrungszyklus auszusetzen bzw. aufzugeben, bevor der Instruktionsausfuhrungszyklus vollen- 
det ist Im Gegensatz zu emer ISA, die auf Echtzeitbewegungssteuerung ausgerichtet ist benddgt eine ISA, die 50 
auf Bildfaltungsoperauonen ausgerichtet ist Interruptantwortfahigkeiten, die gewahrleisten, daB die Anzahl der 
Faltungsoperadonen, die pro Zeiteinheit durchgefflhrt wird, maximiert ist Der Konfigurationsdatensatz, der der 
Bildfaltungs-ISA entspricht beinhaltet vorzugsweise Interruptantwortsignale, die spezifizierert daB eine Unter- 
brechung mit langer Warte- bzw. Verzogerungszeit erforderlich ist Die entsprechenden Obergangssteuersigna- 
le identifizieren einen Zustand W vorzugsweise als einen unterbrechbaren. In dem Fall, daB die ISS 100 mehrere 55 
Sitze von Zustanden F, D, E und W parallel unterstutzt identifizieren die Bildsteuersignale, wenn sie konfigu- 
riert sind, um die Bildfaitungs-ISA zu realisieren, jeden Zustand W als unterbrechbar und spezifizieren weiter, 
daB das Abarbeiten bezuglich des Interrupts verzdgert werden soil, bis jede der parallelen Instruktionsausfuh- 
rungszyklen ihre Zustand-W-Operationen beendet hat Dies gewahrleistet daB eine ganze Gruppe von Instruk- 
tionen ausgefuhrt werden wird, bevor ein Interrupt abgearbeitet wird, wodurch vernunftige FlieBband-Ausfuh- eo 
rungsleistungspegel bzw. gepipelinte Ausfuhrungsleistungspegel aufrechterhalten werden, 

In einer Art und Weise, die analog zu dem Pegel der Interruptverzdgerungszeit ist variiert der Pegel bzw. das 
Niveau der Interruptprlzision, wie sie durch die Interruptantwortsignale spezifiziert werden, ebenso in Abhan- 
gigkeit von der ISA, fur die die DRPU 32 konfiguriert ist Zum Beispiel geben die Interruptantwortsignale in dem 
Fall, daB ein Zustand M als ein unterbrechbarer Zustand fur eine AuBenschleifen-ISA festgelegt ist die unter- 65 
brechbare Multizyklusoperationen unterstQtzt vorzugsweise vor, daB praztse Interrupts erforderlich sind Die 
Obergangssteuersignale spezifizieren somit bzw. geben somit vor, daB Interrupts, die in dem Zustand M 
empfangen werden, als prazise Interrupts behandelt werden, um zu gewahrleisten, daB Multizyklusoperationen 
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erfolgreich erneut gestartet werden kdnnen. In einem anderen Beispiel bezOglich ciner ISA, die nicht fehlbare 
bzw. nicht fehlerbebaftete FlieBband-Arithmetikoperationen untersttitzt, spezifizieren Intemiptantwortsignale 
vorzugsweise, daB ungenaue bzw. unprazise Interrupts erforderlicb sind. Die Obergangssteuersignale spezifizie- 
ren dann bzw. geben dann vor, daB die Interrupts, die im Zustand W empfangen werden, als unprazise Interrupts 
5 behandelt werden. 

BezOglich jeder gegebenen ISA werden die Interruptantwortsignale durch einen Abschnitt des Datensatzes, 
der der ISA entspricht, festgelegt oder programmiert Ober programmierbare Intemiptantwortsignale und die 
Erzeugung von entsprechenden Obergangssteuersignalen erleichtert die vorliegende Erfindung die Realisierung 
eines optimalen Interruptschemas auf einer ISA-durch-ISA-Basis. Fachleute werden erkennen, daB die Oberwie- 
io gende Mehrzahl von Computerarchitekturen nach dem Stand der Technik nicht fur die flexible Spezifizierung 
von Unterbrechungsfahigkeiten bzw. InterruptfaJiigkeiten, namlich programmierbare Zustands-Obergangsfrei- 
gabe, programmierbare Intemiptverzdgerungszeit und programmierbare Interruptprazision sorgen. Bei der 
bevorzugten Ausfuhrungsform ist die Interruptlogik 106 als eine CLB-basierte Zustandsmaschine realisiert, die 
die oben beschriebenen Zustande unterstQtzt 
is Die Abrufsteuereinheit 108 verwaltet das Laden von Instruktionen in den Instruktionspuffer 110 in Antwort 
auf das Abrufsignal, das von der ISS 100 ausgegeben wird. Bei der bevorzugten Ausfuhrungsform ist die 
Abrufsteuereinheit 108 als eine herkdramliche "One-Hot" codierte bzw. Monoflog-kodierte Zustandsmaschine 
realisiert, die Flipflops innerhalb eines Satzes von CLBs verwendet Fachleute werden erkennen, daB bei einer 
alternatives Ausfuhrungsform die Abrufsteuereinheit 108 als eine konventionell codierte Zustandsmaschine 
20 oder als eine ROM-basierte Zustandsmaschine konfiguriert werden kdnnte. Der Instruktionspuffer 110 stellt 
eine temporare Speicherung fur Instruktionen bereit, die von dem Speicher 34 geladen werden. FOr die Realisie- 
rung einer AuBenschleif en-ISA ist der Instruktionspuffer 110 vorzugsweise als herkdmmlicher RAM-basierter 
"Zuerst-rein, Zuerst-raus"- bzw. "First In, First Ouf-{FIFO)-Puf fer realisiert, der eine Vielzahl von CLBs verwen- 
det FOr die Realisierung einer Innenschleifen-ISA ist der Instruktionspuffer 110 vorzugsweise als ein Satz von 
25 Flipflop-Register realisiert, die eine Vilzahi von Flipflops innerhalb eines Satzes von IOBs oder eine Vielzahl von 
Flipflops innerhalb sowohl IBOs als auch CLBs verwendet. 

Die Decodersteuereinheit 112 verwaltet den Transfer von Instruktionen von dem Instruktionspuffer 110 in 
den Instruktionsdecoder 1 14 in Antwort auf das Decodiersignal, das von der ISS 100 ausgegeben wird. BezOglich 
einer Innenschleif en- ISA ist die Decodiersteuereinheit 1 12 vorzugsweise als eine Zustandsmaschine auf ROM- 
30 Basis realisiert, die ein ROM auf CLB-Basis aufweist, das mit einem Register auf CLB-Basis verbunden ist 
BezOglich einer AuBenschleifen-ISA ist die Decodiersteuereinheit 112 vorzugsweise als eine codierte Zustands- 
maschine auf CLB-Basis realisiert BezOglich jeder Instruction, die als Eingang empfangen wird, gibt der 
Instruktionsdecoder 114 einen entsprechenden Operationscode bzw. Opcode, eine Registerfileadresse und 
optional eine oder mehrere Konstanten in einer herkdmmlichen Art und Weise aus. BezOglich einer Innenschlei- 
35 fen-ISA ist der Instruktionsdecoder 114 vorzugsweise konfiguriert urn eine Gruppe von Instruktionen zu 
decodieren, die als ein Eingang bzw. ein Eingangssignal empfangen werden. Bei der bevorzugten Ausfuhrungs- 
form ist der Instruktionsdecoder 114 als ein Decoder auf CLB-Basis bzw. als ein CLB-basierter Decoder 
konfiguriert, urn jede der Instruktionen zu decodieren, die in der ISA, die gegenwlrtig betrachtet wird, beinhaltet 
sind. 

40 Der Operationscode-Speicherregistersatz 116 stellt eine temporare Speicherung fur jeden Operationscode 
bereit, der durch den Instruktionsdecoder 144 ausgegeben wird und gibt jeden Operationscode bzw. Opcode zu 
der ISS 100 aus. Wenn eine AuBenschleif en-ISA in der DRPU 32 realisiert wird, wird der Operationscode-Spei- 
cherregistersatz 116 vorzugsweise realisiert, indem eine optimale Anzahl an Flip flop- Registerbanken verwendet 
wird Die Flipflop-Registerbanke empfangen Signaie von dem Instruktionsdecoder 114, die Klassen- oder 

45 Gruppencodes darstellen, die von Operationscode-Literal-Bitfeldern von Instruktionen abgeleitet werden, die 
zuvor durch den Instruktionspuffer 110 geschleust wurden bzw. dort in einer Warteschlange eingereiht wurden. 
Die Flipflop-Registerbanke speichern die zuvor erwahnten Klassen- oder Gruppencodes gemaB einem Deco- 
dierscheraa, das vorzugsweise die ISS-FComplexitat minimiert. Fur den Fall einer Innenschleifen-ISA speichert 
der Operationscode-Speicherregistersatz 116 vorzugsweise Operationscode-Hinweissjgnale, die direkter von 

so den Operationscode-Bitfeldern abgeleitet werden, die durch den Instruktionsdecoder 114 ausgegeben werden. 
Innenschleif en- IS As weisen notwendigerweise kleinere Operationscode-Literal-Bitfelder auf, wodurch die Rea- 
lisienmgserfordernisse fur das Puffern, Decodieren bzw. Operationscode-Anzeigen fur das Sequenzieren von 
Instruktionen durch den Instruktionspuffer 110, den Instruktionsdecodierer 114 bzw. den Operationscode-Spei- 
cherregistersatz 116 minimiert werden. ZusammengefaBt ist bezOglich AuBenschleifen-ISAs der Operationsco- 

55 de-Speicherregistersatz 116 vorzugsweise als ein kleiner Verbund von Flipflop-Registerbanken realisiert, die 
durch eine Bitbreite charakterisiert sind, die ^eich der Operationscode-Literal-Grd&e ist oder einen Bruchteil 
davon darstellt BezOglich Innenschleifen-ISAs ist der Operationscode-SpeicherTegistersatz 116 vorzugsweise 
eine kleinere und gleichmaBigere Flipflop-Registerbank als bezOglich AuBenschleifen-ISAs. Die reduzierte 
Flipflop-RegisterbankgrdBe in dem Innenschleifenfall spiegelt die niinimale Instruktionszahlcharakteristik von 

60 Innenschleifen-ISAs relativ zu AuBenschleifen-ISAs wieder. 

Der RF-AdreBre gist ersatz 118 bzw. der Konstantenregistersatz 120 stellen eine temporare Speicherung fur 
jede Registerfileadresse bzw. fur jede Konstante bereit, die durch den Instruktionsdecoder 1 14 ausgegeben wird. 
Bei der bevorzugten Ausfuhrungsform werden der Operationscode-Speicherregistersatz 116, der RF-AdreBre- 
gistersatz 1 18 und der Konstantenregistersatz 120 jeweils als ein Satz von CLBs realisiert, die fur die Datenspei- 

65 cherung konfiguriert sind. 

der Speicherzugriffslogik 102 handelt es sich um eine Speicher-Steuerschaltung, die den Transfer bzw. die 
Ubertragung von Daten zwischen dem Speicher 34, der DOU 62 und der AOU 64 gemaB der atomaren 
SpeicheradressengroBe verwaltet und synch ronisiert, die in dem Architekturbeschreibungsspeicher 122 spezifi- 



16 




DE 196 14 991 Al 

ziert ist Die Speicherzugriffslogik 102 verwaltet und synchronisiert zusatzlich den Transfer von Daten und 
Befehlen bzw. Komraandos zwischen der S-Maschine 12 und einer gegebenen T-Maschine 14. Bei der bevorzug- 
ten Ausfuhrungsform unterstutzt die Speicherzugriffslogik 102 Burstmodus-Speicherzugriffe und sie ist vor- 
zugsweise als eine herkSramliche RAM-Steuereinrichtung realisiert, die CLBs verwendet Fachleute werden 
erkennen, daB wahrend der Rekonfiguration die Eingangs- und Ausgangspins bzw. -anschlusse der Rekonfigu- 5 
rierbaren Logikvorrichtung drei Zustande aufweisen, die ohrasche AbschlGsse ermoglichen. urn unaktive bzw. 
nicht angesteuerte Logikpegei festzulegen, und sie werden somh nicht den Speicher 34 stdrea Bei einer 
alternativen Ausfuhrungsform kdnnte die Speicherzugriffslogik 102 auBerhalb der DRPU32 realisiert sein. 

Nimmt man nun Bezug auf Fig. 8, so ist eine Datenoperationseinheit bzw. *Data Operate Unit" 62 gezeigt Die 
DOU 62 fuhrt bezQglich der Daten Operationen gemaB den DOU-Steuersignalen. RF- Adressen und Konstanten 10 
durch, die von der ISS 100 erapfangen werden. Die DOU 62 umfafk einen DOU-Crossbar-Schalter (X-Bar-Schal- 
ter) 150, eine Ab speicher-/ Ausrichtlogik 152 und eine Datenoperationslogik 154. Sowohl der DOU-Crossbar- 
Schalter 150 als aucb die Abspeicher-AAusrichtlogik 152 und die Datenoperationslogik 154 umfassen einen 
Steuereingang, der mit dem ersten Steuerausgang der IFU 60 Qber die erste Steuerieitung 70 verbunden ist Der 
DOU-Crossbar-Schalter 150 umfaBt einen bidirektionalen Datenport, der den bidirektionalen Datenport des 15 
DOU ausbildet; einen Konstanteneingang, der mit der dritten Steuerieitung 74 verbunden ist; einen ersten 
Datenruckfuhreingang bzw. Daten-Feedback-Eingang, der mit einem Datenausgang der Datenoperationslogik 
154 Qber eine erste Datenleitung 160 verbunden tst; einen zweiten DatenrQckfuhreingang bzw. Daten-Feed- 
back-Eingang, der mit einem Datenausgang der Abspeicher-/ Ausrichtlogik 152 Qber eine zweite Datenleitung 
164 verbunden ist; und einen Datenausgang, der mit einem Dateneingang der Abspeicher-/ Ausrichtlogik 152 20 
uber eine dritte Datenleitung 162 verbunden ist Zusatzlich zu ihren Datenausgangen umfaBt die Abspeicher- 
/Ausrichtlogik 154 einen Adressen eingang, der mit der dritten Steuerieitung 74 verbunden ist Die Datenopera- 
tionslogik 154 weist zusatzlich einen Dateneingang auf, der mit dem Ausgang der Abspeicher-/ Ausrichtlogik 
Uber die zweite Datenleitung 1 64 verbunden ist 

Die Datenoperationslogik 154 fuhrt arithmetische, Schiebe- und/oder iogische Operationen bezQglich der 25 
Daten durch, die bei ihrera Dateneingang in Antwort auf die DOU-Steuersignale empfangen werden, die bei 
ihrem Steuereingang empfangen werden. Die Abspeicher-/ Ausrichtlogik 152 umfaBt Datenspeicherelemente, 
die eine temporare Speicherung bezQglich Operanden, Konstanten und Teilergebnissen, die mit Datenberech- 
nungen verbunden sind, bereitstellen, und zwar unter der Verwaltung der RF-Adressen bzw. DOU-Steuersigna- 
le, die bei ihrem Adresseneingang bzw. Steuereingang empfangen werden. Der DOU-Crossbar-Schalter 150 ist 30 
vorzugsweise ein konventionelles Crossbar-Schalt-Netzwerk, das das Laden von Daten aus dem Speicher 34, 
den Transfer von Ergebnissen, die durch die Datenoperationslogik 154 ausgegeben werden, zu der Abspeicher- 
/Ausrichtlogik 152 des Speichers 34, und das Laden von Konstanten, die durch die IFU 60 ausgegeben werden, in 
die Abspeicher-/Ausrichtlogik 152 in Obereinstimmung mit DOU-Steuerstgnalen, die bei ihrem Steuereingang 
empfangen werden, erleichtert Bei der bevorzugten Ausfuhrungsform hangt die detailiierte Struktur der Daten- 35 
operationslogik 154 von den Typen der Operationen ab t die durch die ISA, die gegenwartig betrachtet wird, 
unterstOtzt werden. Das heiBt, die Datenoperationslogik 154 umfaBt eine Schaltung, um arithmetische und/oder 
Iogische Operationen durchzufuhren, die durch die Datenope ratio nsinstruktionen innerhalb der gegenwartig 
betrachtet en ISA speziflziert werden. In ahnlicher Weise hangt die detailiierte Struktur der Abspeicher-/ Aus- 
richtlogik 152 und des DOU-Crossbar-Schalters 150 von der gegenwartig betrachteten ISA ab. Die detailiierte 40 
Struktur der Datenoperationslogik 154, der Abspeicher-/AusrichtIogik 152 und der DOU-Crossbar-Schalters 
150 gemaB des ISA-Typs wird im folgenden unter Bezugnahme auf die Fig. 9A und 9B beschrieben. 

BezQglich einer AuBenschleifen-ISA ist die DOU 62 vorzugsweise konfiguriert, um serielle Operationen 
bezQglich der Daten durchzufuhren. Nimmt man Bezug auf die Fig. 9A, so ist ein Blockdiagramm bzw. ein 
Blockschaltbild einer ersten beispielhaften Ausfuhrungsform der DOU 61 gezeigt, die fUr die Realisierung einer 45 
Allzweck- AuBenschleifen-ISA konfiguriert ist Eine AlIzwecke-AuBenschleif en-ISA erfordert eine Hardware, 
die konfiguriert ist, um mathematische Operationen, wie z. B. Muldplikation, Addition und Subtraktion; boolsche 
Operationen, wie z. B. AND bzw. UND, ODER bzw. OR und NICHT bzw. NOT; Schiebeoperationen; und 
Rotation soperationen bzw. Drehoperationen durchzufuhren. Somh weist die Datenoperationslogik 154 fur die 
Realisierung einer Allzweck-AuBenschleif en-ISA vorzugsweise eine herkommliche arithmetische Logikeinheit 50 
bzw. "Arithmetic-Logic Unit" (ALLQ/Verschiebeeirmchtung 184 mit einem ersten Eingang, einem zweiten Ein- 
gang, einem Steuereingang und einem Ausgang auf. Die AbspeicherVAusrichtlogik 152 umfaBt vorzugsweise 
einen ersten RAM 180 und einen zweiten RAM 182, von denen jeder einen Dateneingang, einen Datenausgang, 
einen AdreB-Wahleingang und einen Freigabeeingang bzw. Enable-Eingang aufweist Der DOU-Crossbar- 
Schalter 150 umfaBt vorzugsweise ein herkommliche Crossbar-Schaltnetzwerk mit zwei bidirektionalen und 55 
unidirektionalen Crossbar-Verbindungen und mit Eingangen und Ausgangen, die zuvor unter Bezugnahme auf 
die Fig. 8 beschrieben wurdea Fachleute werden erkennen, daB eine wirksame Realisierung des DOU-Crossbar- 
Schalters 150 fur eine AuBenschleifen-ISA, Multiplexer, Drei-Zustands-Puffer, CLB-basierte Logik, direkte 
Verdrahtung oder Untersatze bzw. Subsets von zuvor erwahnten Elementen beinhalten, die in jeglicher Kombi- 
nation durch die Wirkung bzw. Eigenschaft der rekonfigurierbaren Kopplungseinrichtung bzw. rekonfigurierba- eo 
ren Verbindungseinrichtung verbunden werden. Bezuglich einer AuBenschleifen-ISA wird der DOU-Crossbar- 
Schalter 150 realisiert bzw. tmplementiert, um eine serielle Datenbewegung in einer minimal raoglichen Zeit 
voranzutreiben bzw. zu beschleunigen, wahrend e ben so eine maximale Anzahl von einzigen Datenbewegungs- 
Crossbar-Verbindungen bereitgestellt werden, um verallgemeinerte AuBenschleifen-lnstruktionstypen zu un- 
terstutzen. 65 

Der Dateneingang des ersten RAM's 180 ist ebenso wie der Dateneingang des zweiten RAM's 182 uber die 
dritte Datenleitung 162 mit dem Datenausgang des DOU-Crossbar-Schalters 150 verbunden. Die Adressenaus- 
wahleingange des ersten RAM's 180 und des zweiten RAM's 182 sind verbunden, um Registerfileadressen von 
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der IFU 60 fiber die dritte Steuerleitung 74 zu empfangea In ahnlicher Weise sind die Freigabeeingange des 
ersten und des 2weiten RAM's 180, 182 verbunden, urn DOU-Steuersignale Ober die erste Steuerleitung 70 zu 
empfangen. Die Datenausgange des ersten bzw. des zweiten RAM's 180, 182 sind mit dem ersten bzw. dem 
zweiten Eingang der ALU/Verschiebeeinrichtung 184 verbunden und sind ebenso mit dem zweiten Daten- Feed- 
5 back-Eingang des DOU-Crossbar-Schalters 150 verbunden. Der Steuereingang der ALU/Verschiebeeinrich- 
tung 184 ist verbunden, urn die DOU-Steuersignale uber die erste Steuerleitung 70 zu empfangen, und der 
Ausgang der ALU/Verschiebeeinrichtung 184 ist mit dem ersten Datenruckftthreingang des DOU-Crossbar- 
Schalters 150 verbunden. Die Verbindungen zu den ubrigen Eingangen und Ausgangen des DOU-Crossbar- 
Schalters 150 sind mit jenen identisch, die oben unter Bezugnahme auf die Fig. 8 beschrieben wurden. 
io Urn die AusfQhrung einer Datenoperationsinstruktion zu erleichtern, gibt die IFU 60 DOU-Steuersignale, 
RF-Adressen und Konstante zu der DOU 61 wahrend einem der beiden ISS-Zustande E oder M aus. Der erste 
bzw. zweite RAM 180, 182 liefern ein erstes bzw. zweites Registerfile zur teraporaren Datenspeicherung. 
Individaelle Adressen innerhalb des ersten und des zweiten RAM's 180, 182 werden gemaB den RF-Adressen 
ausgew&hlt, die bei dem jeweiligen Adresseneingang jedes RAM's empfangen werden. In ahnlicher Weise wird 
15 das Laden des ersten und zweiten RAM's 180, 182 durch die DOU-Steuersignale gesteuert, die jedes RAM 180, 
182 bei seinem Schreibfreigabeeingang empfangt Bei der bevorzugten Ausfuhrungsform beinhaltet wenigstens 
ein RAM 180, 182 eine Hindurchreichfahigkeit, urn den Transfer von Daten von dem DOU-Crossbar-Schalter 
150 direkt zu der ALU/Verschiebeeinrichtung 184 zu erleichtern. Die ALU/Verschiebeeinrichtung 184 fuhrt 
arithmetische, logische oder Schiebeoperationen bezugliche eines ersten Operanden aus, der von dem ersten 
20 RAM 180 empfangen wird, und/oder bezuglich eines zweiten Operanden aus, der von dem zweiten RAM 182 
empfangen wird, und zwar unter der Verwaltung der DOU-Steuersignale, die bei ihrem Steuereingang empfan- 
gen werden. Der DOU-Crossbar-Schalter 150 leitet selektiv folgendes: I) Daten zwischen dem Speicher 34 und 
dem ersten und zweiten RAM 180, 182; 2) Ergebnisse von der ALU/Verschiebeeinrichtung 184 zu dem ersten 
und zweiten RAM 180, 182 oder dem Speicher 34; 3) Daten, die in dem ersten oder zweiten RAM 180, 182 
25 gespeichert sind, zu dem Speicher 34; und 4) Konstanten von der IFU 60 zu dem ersten und zweiten RAM 180, 
182. Wie zuvor beschrieben wurde, leitet in dem Fall, daB entweder der erste oder der zweite RAM 180, 182 eine 
Hindurchreichfahigkeit beinhaltet, der DOU-Crossbar-Schalter 150 ebenso selektiv Daten von dem Speicher 34 
oder dem Ausgang der ALU/Verschiebeeinrichtung direkt zuruck in die ALU/Verschiebeeinrichtung 184. Der 
DOU-Crossbar-Schalter 150 fuhrt eine bestimrate Leitweg-Operation bzw. Wegeermittlungsoperation gemaB 
30 den DOU-Steuersignalen durch, die bei seinem Steuereingang empfangen werden. Bei der bevorzugten Ausfuh- 
rungsform wird die ALU/Verschiebeeinrichtung 184 realisiert, indem Logikfunktionsgeneratoren innerhalb 
eines Satzes von CLBs und eine Schaltung,die auf mathematische Operationen innerhalb der rekonfigurierbaren 
Logikvorrichtung ausgerichtet ist, verwendet werden. Der erste und zweite RAM 180, 182 werden vorzugsweise 
realisiert; indem die Datenspeicherschaltung, die in einem Satz von CLBs vorliegt, verwendet wird, und der 
35 DOU-Crossbar-Schalter 150 wird vorzugsweise in einer Art und Weise realisiert, wie vorstehend beschrieben. 

Es wird nun auf die Fig. 9B Bezug genommen. Dort ist ein Blockdiagramm bzw. ein Blockschaltbild einer 
zweiten beispielhaften Ausfuhrungsform der DOU 63 gezeigt, die fur die Realisierung einer Innenschleifen-ISA 
konfiguriert ist. Im allgemeinen unterstutzt eine Innenschleifen-ISA retativ wenige spezialisierte Operationen 
und wird vorzugsweise verwendet, urn einen allgemeinen Satz von Operationen bezGglich potentiell groBer 
40 Datens&tze durchzufuhren. Optimale Rechenleistungsfahigkeit wird deshalb fur eine Innenschleifen-ISA durch 
eine Hardware erzeugt, die konfiguriert ist, urn Operationen parallel durchzufuhren. Somtt sind bei der zweiten 
beispielhaften Ausfuhrung der DOU 63 die Datenoperationslogik 154, die Abspeicher-/AusrichtIogik 152 und 
der DOU-Crossbar-Schalter 150 konfiguriert, urn FlieBband-Berechnungen bzw. gepipelinete Berechnungen 
durchzufuhren. Die Datenoperationslogik 154 umfaBt eine FlieBband-Funktionseinheit bzw. gepipelinte Funk- 
45 tionseinheit 194 mit einer Anzahl von Eingangen, einem Steuereingang und einem -ausgang. Die Abspeicher- 
/Ausrichtlogik 152 umfaBt folgendes: 1) einen Satz von herkommlichen Flipflop-Feldem 192; wobei jedes 
Flipflop-Feld 192 einen Dateneingang, einen Datenausgang und einen Steuereingang umfaBt; und 2) eine 
Datenauswahleinrichtung 190 mit einem Steuereingang, einem Dateneingang und einer Anzahl von Datenaus- 
gangen, die der Anzahl der vorliegenden Flipflop-Felder 192 entsprechen, Der DOU-Crossbar-Schalter 150 
50 umfaBt ein herkdmmliches Crossbar-Schaltnetzwerk mit Duplex-unidirektionalen Crossbar- Verbindungen. Bei 
der zweiten beispielhaften Ausfuhrungsform der DOU 63 beinhaltet der DOU-Crossbar-Schalter 150 vorzugs- 
weise die Eingange und Ausgange, die vorhergehend unter Bezugnahme auf die Fig. 8 beschrieben wurden, und 
zwar mit Ausnahme des zweiten Datenruckfuhrein gangs. In einer Art und Weise, die dem AuBenschleifen-ISA- 
Fall analog 1st, kann eine wirksame Realisierung des DOU-Crossbar-Schalters 150 fur eine Innenschleifen-ISA, 
55 Multiplexer, Drei-Zustands-Puffer, eine CLB-basierte Logik, eine direkte Verdrahtung bzw. eine direkte Leitung 
oder einen Untersatz der zuvor erwahnten Elemente, die in rekonfigurierbarer Art und Weise verbunden sind, 
beinhalten. Fur eine Innenschleifen-ISA ist der DOU-Crossbar-Schalter 150 vorzugsweise realisiert, um eine 
parallele Datenbewegung innerhalb eines minimalen Zeitaufwands zu maximieren, wahrend ebenso eine mini- 
male Anzahl von einzigen Datenbewegungs-Crossbar- Verbindungen bereitgestellt wird, um Innenschleifen- 
eo ISA-Instruktionen zu unterstutzen, die eine starke Betonung der FlieBbandbearbeitung aufweisen bzw. die stark 
"gepipelined" sind. 

Der Dateneingang der Datenauswahleinrichtung 190 ist mit dem Datenausgang des DOU-Crossbar-Schalters 
150 uber die erste Datenleitung 162 verbunden. Der Steuereingang der Datenauswahleinrichtung 190 ist verbun- 
den, um RF-Adressen uber die dritte Steuerleitung 74 zu empfangen, und jeder Ausgang der Datenauswahlein- 
55 richtung 190 ist mit einem entsprechenden Flipflop-Feld-Dateneingang verbunden. Der Steuereingang eines 
jeden Ftipflop-Feldes 192 ist verbunden, um DOU-Steuersignale Ober die erste Steuerleitung 70 zu empfangen, 
und jeder Flipflop-Feid-Datenausgang ist mit einem Eingang der Funktionseinheit 194 verbunden. Der Steuer- 
eingang der Funkdonseinheit 194 ist verbunden, um DOU-Steuersignale fiber die erste Steuerleitung 70 zu 
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empfangen, unci der Ausgang der Funktionseinheit 194 ist mit dern ersten Datenruckfuhreingang des DOU- 
Crossbar-Schalters 150 verbunden. Die Verbindungen der verbleibenden Eingange und Ausgange des DOU- 
Crossbar-Schalters 150 sind mit jenen identisch, die zuvor unter Bezugnahme auf die Fig. 8 beschrieben wurden. 

Im Betrieb fuhrt die Funktionseinheit 194 FUeBband-Operationen bzw. gepipelinete Operatiooen bezQglich 
der Daten durch, die bei ihren Dateneingangen in Obereinstimmung mit den DOU-Steuersignalen empfangen 5 
werden, die bei ihrem Steuereingang empfangen werden. Fachleute werden erkennen, daB die Funktionseinheit 
194eine MuJtipUkations-Akkumulationseinheit eine Schweflen-Bestiinmungseinheit, eine Bild-Rotationseinheit, 
eine Kantenverstarkungseinheit bzw. eine Rand vers tarkungseinhe it oder irgendeine Art von Funktionseinheit 
sein kann, die geeignet ist, urn FUeBband-Operationen bzw. gepipelinete Operationen bezfigiich der aufgeteilten 
bzw. partitionierten Daten durchzufuhren. Die Datenauswahleinrichtung 190 leitet Daten von dem Eingang des to 
DOU-Crossbar-Schalters 150 in ein gegebenes Flipflop-Feld 192 gemaB den RF- Adressen, die bei seinem 
Steuereingang empfangen werdea Jedes Flipflop-Feld 192 beinhaltet vorzugsweise einen Satz von sequentiell 
gekoppetten Datenlatches bzw. Datenhaiteeinrichtungen, urn raumlich und temporar Daten relativ zu dem 
Dateninhalt eines anderen Flipflop-Feldes 192 auszurichten, und zwar unter der Verwaltung der Steuersignale, 
die bei seinem Steuereingang empfangen werdea Der DOU-Crossbar-Schalter 150 leitet selektiv folgendes: 1) is 
Daten von dem Speicher 34 zu der Datenauswahleinrichtung 190; 2) Ergebnisse von der Muitiplikations-/Akku- 
raulationseinheit 194 zu der Datenauswahleinrichtung 190 oder dem Speicher 34; und 3) Konstante von der IFU 
60 zu der Datenauswahleinrichtung 190. Fachleute werden erkennen, daB eine Innenschleif en-ISA einen Satz 
von eingebauten bzw. *built-in"-Konstanten aufweist Bei der Realisierung einer derartigen Innenschleif en-ISA 
beinhaltet die Abspeicher-ZAusrichtlogik 154 vorzugsweise ein ROM auf CLB-Basis bzw. ein CLB-basiertes 20 
ROM, das eingebaute Konstanten enthalt, wodurch das Erfordemis beseitigt wird, die Konstanten von der IFU 
60 in die Abspeicher-AAusrichtlogik 152 fiber den DOU-Crossbar-Schalter 150 zu Ieiten. Bei der bevorzugten 
Ausfuhrungsform ist die Funktionseinheit 194 vorzugsweise iraplementiert bzw. realisiert, indem Logikfunk- 
tionsgeneratoren und eine Schaltung, die auf matheraatische Operationen innerhalb eines Satzes von CLBs 
ausgerichtet ist, verwendet werden. Jedes Flipflop-Feld 192 ist vorzugsweise realisiert, indem Flipflops innerhalb 25 
eines Satzes von CLBs verwendet werden, und die Datenauswahleinrichtung 190 ist vorzugsweise implemen- 
tiert, indem lx>gikfunktionsgeneratoren und eine Datenauswahlschaltung innerhalb eines Satzes von CLBs 
verwendet werden. SchlieBlich wird die Codier- und Decodierschaltung 150 vorzugsweise in der zuvor fur eine 
Innenschieifen-ISA beschriebenen Art und Weise realisiert 

Nimmt man nun Bezug auf Fig, 10; so ist ein Btockdiagramm einer bevorzugten Ausfuhrungsform der 30 
Adressenoperationseinheit 64 gezeigt Die AOU 64 fuhrt Operationen bezuglich der Adressen gemaB der 
AOU-Steuersignale, RF- Adressen und. Konstanten durch, die von der IFU 60 empfangen werden. Die AOU 64 
umfaBt einen AOU-Crossbar-Schalter 200, eine Abspeicher-/Zahllogik 202, eine Adressenoperationslogik 204 
und einen Adressen- Multiplexer 206. Sowohl der AOU-Crossbar-Schalter 200 als auch die Abspeicher-/Zahllo- 
gik 202 und die Adressenoperationslogik 204 und der Adressenmultiplexer 206 umfassen einen Steuereingang, 35 
der mit dem zweiten Steuereingang des IFU 60 Ober die zweiten Steuerleitung 72 verbunden ist. Der AOU- 
Crossbar-Schalter 200 umfaBt einen bidirektionalen Datenport, der den bidirektionalen Datenport des AOU 
ausbildet; einen Adressen- RuckfQhreingang, der mit einem Adressenausgang der Adressenoperationslogik 204 
fiber eine erste Adressenleitung 201 verbunden ist; einen Konstanteneingang, der mit der dritten Steuerleitung 
74 verbunden; und einen Adressenausgang, der mit einem Adresseneingang fiber der Abspeicher-/ZahlIogik 202 40 
fiber eine zweite Adressenleitung 212 verbunden ist Zusatzlich zu seinem Adresseneingang und Steuereingang, 
weist die Abspeicher-/Zahilogik 202 einen RF-Adresseneingang auf, der mit der dritten Steuerleitung 74 verbun- 
den ist, und einen Adressenausgang auf, der mit einem Adresseneingang der Adressenoperationslogik 204 fiber 
eine dritte Adressenleitung 214 verbunden ist Der Adressenmultiplexer 206 umfaBt einen ersten Eingang, der 
mit der ersten Adressenleitung 210 verbunden ist, einen zweiten Eingang, der mit der dritten Adressenleitung 45 
214 verbunden ist, und einen Ausgang, der den Adressenausgang der AOU 64 ausbildet 

Die Adressenoperationslogik 204 fuhrt arithmetische Operationen bezuglich der Adressen durch, die bei 
ihrem Adresseneingang empfangen werdea und zwar unter der Verwaltung der AOU-Steuersignale, die bei 
ihrem Steuereingang empfangen werden. Die Abspeicher-ZZShllogik 202 stellt eine temporare Speicherung von 
Adressen bereit und adressiert Rechenergebnisse. Der AOU-Crossbar-Schalter 200 erieichtert das Laden von so 
Adressen von dem Speicher 34, den Transfer von Ergebnissen, die durch die Adressenoperationslogik 204 
ausgegeben werden, zu der Abspeicher-ZZahllogik 202 oder dem Speicher 34, und das Laden von Konstanten, 
die durch die IFU 60 ausgegeben werden, in die Abspeicher-/Zahi!ogik 202 in Obereinstimmung mit den 
AOU-Steuersignalen, die bei ihrem Eingang empfangen werden. Der Adressenmultiplexer 206 gibt selektiv eine 
Adresse, die von der AbspeicherVZahilogik 202 oder der Adressenoperationslogik 200 empfangen wird, zu dem 55 
Adressenausgang der AOU 64 unter der Verwaltung des AOU-Steuersignals aus, das bei seinem Steuereingang 
empfangen wird Bei der bevorzugten Ausfuhrungsform hangt die detaillierte Struktur des AOU-Crossbar- 
Schalters 200, der Abspeicher-/Ausrichtlogik 202 und der Adressenoperationseinheit 204 von dem Typ der ISA 
ab, die gegenwartig betrachtet wird, wie im folgenden unter Bezugnahme auf die Fig. 1 1 A und 1 1 B beschrieben 
wird go 

Es wird nun auf die Fig. 11A Bezug genommen. Dort ist ein Blockschaltbild einer ersten beispielhaften 
Ausfuhrungsform der AOU 65 gezeigt die fur die Realisierung einer AIlzweck-Au8enschleifen-ISA konfiguriert 
ist Eine Auzweck-AuBenschleifen-ISA erfordert eine Hardware zur Durchfuhrung von Operationen, wie z. B. 
Addition, Subtraktion, Inkreraentation und Dekreraentation bezfigiich der Inhalte eines Programmzahlers und 
bezuglich Adressen, die in der Abspeicher-/Zahllogik 202 gespeichert sind Bei der ersten beispielhaften Ausfiih- 65 
rungsform der AOU 65 umfaBt die Adressenoperationslogik 204 vorzugsweise ein Programmadressenregister 
bezfigiich nachster Befehle bzw. ein "Next Instruction Program Address Register* (NIPAR) 232 mit einem 
Eingang, einem Ausgang und einem Steuereingang; wobei eine arithmetische Einheit 234 einen ersten Eingang, 
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einen zweiten Eingang, einen dritten Eingang, einen Steuereingang und einen Ausgang umfaBt; und ein Multiple- 
xer 230 einen ersten Ein gang, einen zweiten Eingang, einen Steuereingang und einen Ausgang umfaBt. Die 
Abspeicher-ZZahllogik 202 umfaBt vorzugsweise einen dritten RAM 220 und einen vierten RAM 222, wobei 
jeder einen Eingang, einen Ausgang und einen Adresse nauswahleingang und einen Freigabeeingang umfaBt 
s Der Adressenmultiplexer 206 umfaBt vorzugsweise einen Multiplixer mit einem ersten Eingang, einem zweiten 
Eingang, einem dritten Eingang, einem Steuereingang und einera Ausgang. Der AOU-Crossbar-Schalter 200 
umfaBt vorzugsweise ein herkemmiiches Crossbar-Schaltnetzwerk mit Duplex-unidirektionalen Crossbar-Ver- 
bindungen und mit den Eingangen und Ausgangen, die zuvor unter Bezugnahme auf die Fig. 10 beschrieben 
wurden. Eine wirksame Realisierung des AOU-Crossbar-Schaiters 200 kann Multiplexer, Drei-Zustandspuffer, 

io eine CLB-basierte Logik, eine Direktverdrahtung bzw. eine Direktleitung oder irgendeinen Untersatz von 
derartigen Elemente aufweisen, die durch rekonfigurierbare Verbindungen verbunden sind. Fur eine AuBen- 
schleifen-ISA wird der AOU-Crossbar-Schalter vorzugsweise realisiert, urn die Bewegung bezuglich serieller 
Adressen zu maximieren, und zwar innerhalb eines minimalen Zeitaufwands, wahrend ebenso eine maximale 
Anzahl von einzigen bzw. eindeutigen Adressenbewegungs-Crossbar-Verbindungen bereitgestellt wird, urn 

15 verallgemeinerte AuBenschleifen- ISA-Adressenoperationsinstruktionen zu unterstutzen. 

Der Eingang des dritten RAM's 220 und der Eingang des vierten RAM's 222 sind jeweils mit dem Ausgang des 
AOU-Crossbar-Schaiters 200 tiber die zweite Adressenleitung 212 verbunden. Die Adressenauswahleingange 
des dritten und vierten RAM's 220, 222 sind verbunden, um RF-Adressen von der IFU 60 fiber die dritte 
Steuerleitung 74 zu empfangen, und die Freigabeeingange des ersten und zweiten RAM's 220, 222 sind verbun- 

20 den, um AOU-Steuersignale Qber die zweite Steuerleitung 72 zu empfangen. Der Ausgang des dritten RAM's 
220 ist mit dem ersten Eingang des Multiplexers 230, dem ersten Eingang der arithmetischen Einheit 234 und 
dem ersten Eingang des Adressenmultiplexers 206 verbunden. In ahnlicher Weise ist der Ausgang des vierten 
RAM's 222 mit dem zweiten Eingang des Multiplexers 230, dem zweiten Eingang der arithmetischen Einheit 234 
und dem zweiten Eingang des Adressenmultiplexers 206 verbunden. Die Steuereingange des Multiplexers 230, 

25 der NTIPAR 232 und der arithmetischen Einheit 234 sind jeweils mit der zweiten Steuerleitung 72 verbunden. Der 
Ausgang der arithmetischen Einheit 234 bildet den Ausgang der Adressenoperationslogik 204 und ist deshalb mit 
dem Adressen-Rackfuhreingang des AOU-Crossbar-Schaiters 200 und dem dritten Eingang des Adressenmulti- 
plexers 206 verbunden. Die Verbindungen zu den ubrigen Eingangen und Ausgangen des AOU-Crossbar-Schal- 
ters 200 und des Adressenmultiplexers 206 sind mit jenen identisch, die zuvor unter Bezugnahme auf die Fig. 10 

30 beschrieben wurden. 

Um das Ausffihren einer Adressen-Operationsinstruktion zu erleichtern, gibt die IFU 60 AOU-Steuersignale, 
RF-Adressen und Konstante zu der AOU 64 wahrend eines der beiden ISS-Zustande E oder M aus. Der dritte 
bzw. vierte RAM 220, 222 liefern ein erstes bzw. ein zweites Registerfile fur die temporare Adressenspeicherung. 
Individuelle Speicherstellen innerhalb des dritten und vierten RAM's 220, 222 werden gemaB den RF-Adressen 

35 ausgewahlt, die bei den jeweiligen Adressen- Aus wahl- Eingang jedes RAM's empfangen werden. Das Laden des 
dritten und vierten RAM's 220, 222 wird durch die AOU-Steuersignale gesteuert, die das jeweiUge RAM 220, 222 
bei seinem Schreib-Freigabeeingang empfangt Der Multiplexer 230 Ieitet selektiv Adressen, die durch den 
dritten und vierten RAM 220, 222 ausgegeben werden, zu der NIPAR 232, und zwar unter der Verwaltung der 
AOU-Steuersignale, die bei seinem Steuereingang empfangen werden. Der NIPAR 232 ladt eine Adresse, die 

40 von dem Ausgang des Multiplexers 230 empfangen wird, und inkrementiert ihren Inhalt in Antwort auf das 
AOU-Steuersignal das von seinem Steuereingang empfangen wird- Bei der bevorzugten Ausfuhrungsform 
speichert der NIPAR 232 die Adresse der nachsten Programminstruktion, die auszufuhren ist Die arithmetische 
Einheit 234 fuhrt arithmetische Operationen einschlieBIich Addition, Subtraktion, Incrementation, Dekrementa- 
tion bezuglich der Adressen durch, die von dem dritten und vierten RAM 220, 222 empfangen werden, und/oder 

45 bezuglich des Inhalts des NIPAR 232. Der AOU-Crossbar-Schalter 200 leitet selektiv folgendes: 1) Adressen von 
dem Speicher 34 zu dem dritten und vierten RAM 220, 222; und 2) Ergebnisse der Adressenberechnungen, die 
durch die arithmethische Einheit 234 ausgegeben werden, zu dem Speicher 34 oder dem dritten und vierten 
RAM 220, 222. Der AOU-Crossbar-Schalter 200 fuhrt eine bestimmte Leitwegoperation bzw. Wegermittlungs- 
operation gem£B der AOU-Steuersignale durch, die bei seinem Steuereingang empfangen werden. Der Adres- 

50 senmultiplexer 206 leitet selektiv die Adressen, die durch das dritte RAM 220 ausgegeben werden, Adressen, die 
durch das vierte RAM 222 ausgegeben werden, oder die Ergebnisse von Adressenberechnungen, die durch die 
arithmetische Einheit 234 ausgegeben werden, zu dem Adressenausgang des AOU, und zwar unter der Verwal- 
tung des AOU-Steuersignals, das bei seinem Steuereingang empfangen wird. 
Bei der bevorzugten Ausfuhrungsform werden der dritte und vierte RAM 220, 222 jeweils realisiert, indem die 

55 Datenspeicherschaltung, die innerhalb eines Satzes von CLBs vorliegt, verwendet wird. Der Multiplexer 230 und 
der Adressenmultiplexer 206 werden jeweils vorzugsweise realisiert, indem eine Datenauswahlschaltung ver- 
wendet wird, die innerhalb eines Satzes von CLBs vorhanden ist, und der NIPAR 232 wird vorzugsweise 
realisiert indem die Datenspeicherschaltung, die innerhalb eines Satzes von CLBs vorliegt, verwendet wird. Die 
arithmetische Einheit 234 wird vorzugsweise realisiert, indem logische Funktionsgeneratoren und eine Schal- 

60 tung, die auf mathematische Operationen innerhalb eines Satzes von CLBs ausgerichtet ist, verwendet wird. 
SchlieBlich wird der AOU-Crossbar-Schalter 200 vorzugsweise in einer zuvor beschriebenen Art und Weise 
implementiert 

Es wird nun auf die Fig. 11 B Bezug genommen. Dort ist ein Blockschaltbild einer zweiten exemplarischen 
Ausfuhrungsform der AOU 66 gezeigt, die fur die Implementation einer Innenschleifen-ISA konfiguriert ist 
65 Vorzugsweise erfordert eine Innenschleifen-ISA eine Hardware zur Durchfiihrung eines sehr beschrankten 
Satzes von Adressenoperationen und eine Hardware zur Aufrechterhaltung wenigstens eines Quellenadressen- 
zeigers und einer entsprechende Anzahl von Bestiramungsadressenzeigern. Arten von Innenschleifenverarbei- 
tung, fur die eine sehr beschrankte Anzahl von Adressenoperationen oder sogar eine einzige Adressenoperatton 
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bendtigt werden, beinhalten Block-. Raster- oder Serpentinenoperationen bezflglich der Bilddaten; Bit-Umkehr- 
operationen; Opera tionen bezGglich zirkularer Pufferdaten; und Parsingoperationen bezGglich variabler Daten- 
mengen. Hier wird eine einzige Adressenoperation, namlich eine Inkrementoperation, betrachtet Fachieute 
werden erkennen, daB Hardware, die Inkrementoperationen durchftthrt, ebenso inharent in der Lage sein kann. 
Dekrementoperationen durchzufuhren, wodurch eine zusatzliche Adressenoperationsfahigkeit bereitgestellt 
wird Bei der zweiten beispielhaften Ausfuhrungsform der AOU 66 umfaBt die Abspeicher-ZZahllogik 202 
wenigstens ein Quellenadressenregister 202 mit einem Eingang, einem Ausgang und einem Steuereingang; 
wenigstens ein Bestimmungsadressenregister 254 mit einem Eingang, einem Ausgang und einem Steuereingang; 
und eine Datenauswahieinricbtung 250 mit einem Eingang, einem Steuereingang und einer AnzahJ von Ausgan- 
gen, die gleich der gesamten Anzahl der vorliegenden Quellen- und Bestimmungsadressenregisters 252, 254 ist 
Hier werden ein Einzelquellen-Adressenregister 252 und ein Einzelbestimmungs-Adressenregister 254 betrach- 
tet, und somit hat die Datenauswahleinrichtung 250 einen ersten Ausgang und einen zweiten Ausgang. Die 
Adressenope rations I ogik 204 umfaBt ein NIPAR 232 mit einem Eingang, einem Ausgang und einem Steueraus- 
gang; einen Multiplexer 260 rait einer Anzahl von Eingangen, die gleich der Anzahl von DatenauswahJausgangen 
ist, einen Steuereingang und einen Ausgang. Hier umfaBt der Multiplexer 260 einen ersten Eingang und einen 
zweiten Eingang. Der Adressenmultiplexer 206 umfaBt vorzugsweise einen Multiplexer mit einer Anzahl von 
Eingangen, die um 1 groBer ist als die Anzahl von DatenauswahJausgangen, einem Steuereingang und einem 
Ausgang. Somit umfaBt der Adressenmultiplexer 206 einen ersten Eingang, einen zweiten Eingang und einen 
dritten Eingang. Der AOU-Crossbar-Schalter 200 umfaBt vorzugsweise ein herkommliches Cross bar-Schalt- 
netzwerk mit bidirektionalen und unidirektionalen Crossbarverbindungen und mit den Eingangen und Ausgan- 
gen, die zuvor unter Bezugnahme auf die Fig. 10 beschrieben wurdea Eine wirksarne Realisierung des AOU- 
Crossbar-Schalters 200 kann Multiplexer, Drei-Zustands-Puffer, eine CLB-basierte Logik, direkte Verdrahtung 
bzw. eine direkte Leitung oder sonstige Untersatze von derartigen Elementen enthalten, die durch rekonfigu- 
rierbare Verbindungen verbunden sind Fur eine Innenschleifen-ISA wird der AOU-Crossbar-Schalter 200 
vorzugsweise realisiert, um eine parallele Adressenbewegung in einer minimal moglichen Zeit zu maximieren, 
wahrend ebenso eine minim ale Anzahl von einzigen bzw. eindeutigen Adressen-Bewegungs-Crossbar- Verbin- 
dungen bereitgestellt werden, um Innenschleifen-Adressenoperationen zu unterstGtzen. 

Der Eingang der Datenauswahleinrichtung 250 ist mit dem Ausgang des AOU-Crossbar-Schalters 200 ver- 
bunden- Der erste bzw. zweite Ausgang der Datenauswahleinrichtung 250 sind mit dem Eingang des Quellen- 
adressenregisters 252 bzw. mit dem Eingang des Bestimmungsadressenregisters 254 verbunden. Die Steuerein- 
gange des Quellenadressenregisters 252 und des Bestimmungsadressenregisters 254 sind verbunden, um AOU- 
Steuersignale uber die zweite Steuerleitung 72 zu empfangen. Der Ausgang des Quellenadressenregisters 252 ist 
mit dem ersten Eingang des Multiplexers 260 und dem ersten Eingang des Adressenmultiplexers 206 verbunden. 
In ahnlicher Weise ist der Ausgang des Bestimmungsregisters 254 mit dem zweiten Eingang des Multiplexers 254 
und dem zweiten Eingang des Adressenmultiplexers 206 verbunden. Der Pingnng des NIPAR 232 ist mit dem 
Ausgang des Multiplexers 260 verbunden, der Steuereingang des NIPAR 232 ist verbunden, um AOU-Steuersi- 
gnale Ober die zweite Steuerleitung zu empfangen, und der Ausgang des NIPAR 232 ist sowohl mit dem 
Adressen-Ruckfuhreingang bzw. Adress en-Feedback- Eingang des AOU-Crossbar-Schalters 200 als auch mit 
dem dritten Eingang des Adressenmultiplexers 206 verbunden. Die Verbindungen zu den Qbrigen Eingangen und 
Ausgangen des AOU-Crossbar-Schalters 200 sind mit den zuvor unter Bezugnahme auf die Fig. 10 beschriebe- 
nen identisch. 

Im Betrieb leitet die Datenauswahleinrichtung 250 Adressen, die von dem AOU-Crossbar-Schalter empfan- 
gen werden, zu dem Quellenadressenregister 252 oder dem Bestiraraungsadressenregister 254 gemaB den 
RF-Adressen, die bei ihrem Steuereingang empfangen werden. Das Quellenadressenregister 252 ladt eine 
Adresse, die an ihrem Eingang vorliegt, als Antwort auf das AOU-Steuersignal, das bei seinem Steuereingang 
vorliegL Das Bestimmungsadressenregister 254 ladt eine Adresse, die bei seinem Eingang vorliegt, in einer 
analogen Art und Weise, Der Multiplexer 260 leitet eine Adresse, die von dem Quellenadressenregister 252 oder 
dem Bestimmungsadressenregister 254 empfangen wird, zu dem Eingang des NIPAR 232 gemaB den AOU-S teu- 
ersignalen, die bei seinem Steuereingang empfangen werden. Das NIPAR 232 ladt eine Adresse, die bei seinem 
Eingang vorliegt, inkrementiert ihren Inhalt oder dekrementiert ihren Inhalt in Antwort auf die AOU-Steuersi- 
gnale, die bei seinem Steuereingang empfangen werden. Der AOU-Crossbar-Schalter 200 leitet selektiv folgen- 
des: 1) Adressen von dem Speicher 34 zu der Datenauswahleinrichtung 250; und 2) die Inhalte des NIPAR 232 zu 
dem Speicher 34 oder der DatenauswaWeinrichtung 250. Der AOU-Crossbar-Schalter 200 fuhrt eine bestimmte 
Leitwegoperation bzw. Wegeermittlungsoperation gemaB den AOU-Steuersignal durch, die bei seinem Eingang 
empfangen werden. Der Adressenmultiplexer 206 leitet selektiv die Inhalte des Quellenadressenregisters 252, 
des Bestimmungsadressenregisters 254 oder des NIPAR 232 zu dem Adressenausgang des AOU's, und zwar 
unter der Verwaltung der AOU-Steuersignale, die aus einem Steuereingang empfangen werden. 

Bei der bevorzugten Ausfuhrungsform sind sowohl das Quellenadressenregister 252 als auch das Bestim- 
mungsadressenregister 254 verwirklicht, indem die Datenspeicherschaltung verwendet wird, die innerhalb eines 
Satzes von CLBs vorliegt Das NIPAR 232 wird vorzugsweise verwirklicht, indem eine Inkrement-/Dekrement- 
logik und Flipflops innerhalb eines Satzes von CLBs verwendet werden. Die Datenauswahleinrichtung 250, der 
Multiplexer 230 und der Adressenmultiplexer 206 werden jeweils vorzugsweise verwirklicht, indem eine Daten- 
auswahlschaltung verwendet wird, die innerhalb eines Satzes von CLBs vorliegt SchlieBlich wird der AOU- 
Crossbar-Schalter 200 vorzugsweise in der zuvor fur einen Innenschleifen-ISA beschriebenen Art und Weise 
verwirklicht Fachieute werden erkennen, daB es bei bestimraten Anwendungen vorteilhaft sein kann, eine ISA 
zu verwenden, die sich auf eine Innenschleifen-AOU-Konfiguration mit einer AuBenschleifen-DOU-Konfigura- 
tion oder umgekehrt yerlaBt Zum Beispiel wiirde eine assoziative String-Such-ISA vorteilhaft eine Innenschlei- 
fen-DOU-Konfiguration mit einer AuBenschleifen-AOU-Konfiguration nutzen. GemaB einem anderen Beispiel 
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wflrde eine ISA zur Durchf Qhrung von Histogrammoperationen vorteilhaf t eine AuBenschleifen-DOU-Konfigu- 
ration mit einer Innenschleifen-AOU-Konfiguration nutzen. 

Finite bzw. endiiche rekonfigurierbare Hardware-Systeraelemente mussen zwischen jedem Element der 
DRPU 32 zugewiesen werden. Weil die rekonfigurierbaren Hardware-Systemelemente in ihrer Anzahl be- 
5 schrankt sind, beeinfluBt bzw. beeintrachtigt die Art und Weise, in der sie der IFU 60 zugeordnet sind, z. B. den 
maximalen Rechenleistungsfahigkeitspegel, der durch die DOU 62 und die AOU 64 erreichbar ist. Die Art und 
Weise, in der die rekonfigurierbaren Hardware-Systeraelemente zwischen der IFU 60, der DOU 62 und der 
AOU 64 zugewiesen sind, variiert gernaB der Art der ISA, die zu jedem gegebenen Augenblick zu implementie- 
ren ist Wenn die ISA-Komplexitat zunimmt, mussen mehr rekonfigurierbare Hardware-Systemelemente der 

10 IFU €0 zugewiesen werden, um die zunehmend komplexen Decodier- und Steueroperationen zu erleichtern, was 
dazu fOhrt, daB weniger rekonfigurierbare Hardware-Systemelemente zwischen der DOU 62 und der AOU 64 
verfugbar bleiben. Somit nimmt die maximale Rechenleistung, die von der DOU 62 und der AOU 64 erreicht 
werden kann, mit der ISA-Kompiexitat ab. Im allgemeinen wird eine AuBenschleifen-ISA viel mehr Instruktio- 
nen aufweisen als eine Innenschleifen-ISA, und deshalb wird ihre Realisierung in Termen der Decodier- und 

j5 Steuerschaltung betrachdich komplexer sein. Zum Beispiel wflrde eine AuBenschleifen-ISA, die einen Allzweck- 
64-Bit-Prozessor festiegt, viel mehr Instruktionen aufweisen als eine Innenschleifen-ISA, die nur auf Datenkom- 
primierung ausgerichtet ist 

Nimmt man nun Bezug auf die Fig. 12A, so ist ein Diagramm gezeigt, das eine examplarische Zuweisung von 
rekonfigurierbaren Hardware-Systemelementen zwischen der IFU 60, der DOU 62 und der AOU 64 fdr eine 

20 AuBenschleifen-ISA zeigt Bei der beispielhaften Zuweisung von rekonfigurierbaren Hardware-Systemelemen- 
ten fur die AuBenschleifen-ISA werden der IFU 60, der DOU 62 und der AOU 64 jeweiis ein Drittel der 
verf Qgbaren rekonfigurierbaren Hardware-Systemelemente bzw. Hardware-Ressourcen zugewiesen. Fur den 
Fall, daB die DRPU 32 rekonfiguriert werden soil, um eine Innenschleif en-ISA zu verwirklichen, werden weniger 
rekonfigurierbare Hardware-Systemelemente benatigt, um die IFU 60 und die AOU 64 zu verwirklichen, und 

25 zwar aufgrund der beschrankten Anzahl von Instruktionen und Typen von Adressenoperationen, die durch eine 
Innenschleif en- ISA unterstiltzt werden. Nimmt man nun Bezug auf die Fig. 12B, so ist ein Diagramm gezeigt, 
daB eine beispielhafte Zuweisung von rekonfigurierbaren Hardware-Systemelementen bzw. Hardware-Res- 
sourcen zwischen der IFU 60, der DOU 62 und der AOU 64 f Or eine Innenschleif en-ISA zeigt Bei der beispiel- 
haften Zuweisung von rekonfigurierbaren Hardware-Systemelementen fur die Innenschleifen-ISA wird die IFU 

30 60 verwirklicht, indem ungefahr 5— 10% der rekonfigurierbaren Hardware-Systemelemente verwendet werden, 
. und die AOU 64 wird verwirklicht, indem ungefahr 10—25% der rekonfigurierbaren Hardware-Systemelemente 
verwendet werdea Somit verbleiben ungefahr 70—80% der rekonfigurierbaren Hardware-Systemelemente fur 
die Realisierung der DOU 62 verfugbar. Dies wiederum bedeutet, daB die interne Struktur der DOU 62, die mit 
der Innenschleifen-ISA in Zusammenhang steht bzw. dieser zugeordnet ist, komplexer sein kann und deshalb 

35 eine betrachtlich hdhere Leistungsfahigkeit anbietet als die interne Struktur der DOU 62, die mit der AuBen- 
schleifen-ISA im Zusammenhang steht bzw. dieser zugeordnet ist 

Fachleute werden erkennen, daB die DRPU 32 in einer alternativen Ausf uhrungsform entweder die DOU 62 
oder die AOU 64 ausschlieBen kann. Zum Beispiel kann in einer alternativen Ausfiihrungsform die DRPU 32 
nicht eine AOU 64 beinhaiten. Die DOU 62 wurde dann fur die Durchf uhrungsoperationen bezOglich sowohl der 

40 Daten als auch der Adressen verantwortlich sein, Unabhangig von der bestimmten DRPU-Ausfuhrung, die 
betrachtet wird, muB eine finite bzw. endiiche Zahl von rekonfigurierbaren Hardwarequellen zugewiesen 
werden. um die Elemente der DRPU 32 zu realisieren. Die rekonfigurierbaren Hardware-Systemelemente 
werden vorzugs weise derart zugewiesen, daB eine optimale Leistungsfahigkeit oder eine beinahe optimal e 
Leistungsfahigkeit beziiglich der gegenwartig betrachteten ISA relanv zu dem gesamten Raum von i verf ugbaren 

45 rekonfigurierbaren Hardware-Systemelementen erreicht wird. Fachleute werden erkennen, daB die detaillierte 
Struktur eines jeden Elements der IFU 60, der DOU 62 und der AOU 64 nicht auf die Ausftthrungsformen 
beschrankt ist, die oben beschrieben wurden. Fur eine gegebene ISA ist der entsprechende KLonf igurationsda- 
tensatz vorzugsweise derartig festgelegt, daB die interne Struktur eines jeden Elements innerhalb der IFU 60, 
der DOU 62 und der AOU 64 die Rechenleistungsfahigkeit relativ zu den verfflgbaren rekonfigurierbaren 

50 Hardware-Systemelementen maximiert. 

Nimmt man nun Bezug auf die Fig. 13, so ist ein Blockdiagramm einer bevorzugten Ausfuhrungsform einer 
T-M aschine 14 gezeigt. Die T-Maschine 14 umfaBt eine zweite lokale Zeitbasiseinheit 300, eine gemeinsame 
Schnittstellen- und Steuereinheit 302 und einen Satz von Verbindungs-I/O-Einheiten 304. Die zweite lokale 
Zeitbasiseinheit 300 weist einen Zeitsteuereingang auf, der den Master-Zeitsteuereingang der T-Maschine 

55 ausbildet. Die gemeinsame Schnittstellen- und Steuereinheit 302 umfaBt einen Zeitsteuereingang, der mit einem 
Zeitsteuerausgang der zweiten lokalen Zeitbasiseinheit 300 Qber eine zweite Zeitsteuersignalleitung 310 verbun- 
den ist, einen Adressenausgang, der mit der Adressenleitung 44 verbunden ist, einen ersten bidirektionalen 
Datenport, der mit der Speicher-I/O-Leitung 46 verbunden ist, einen bidirektionalen Steuerport, der mit der 
externen Steuerleitung 48 verbunden ist, und einen zweiten bidirektionalen Datenport, der mit einem btdirektio- 

60 nalen Datenport einer jeden Verbindungs-I/O-Einheit 304, die vorliegt, Uber eine Nachrichtenubertragungslei- 
tung 312 verbunden ist Jede Verbindungs-I/O-Einheit 304 umfaBt einen Eingang, der rait der GPIM 16 Qber eine 
Nachrichteneingangsleitung 314 verbunden ist, und einen Ausgang, der mit der GPIM 16 fiber eine Nachrichten- 
ausgangsleitung 316 verbunden ist. 

Die zweite lokale Zeitbasiseinheit 300 innerhalb der T-Maschine 14 empfangt das Master-Zeitsteuersignal von 

65 der Master-Zeitbasiseinheit 22 und erzeugt ein zweites lokals ZeitsteuersignaL Die zweite lokale Zeitsteuerein- 
heit 300 liefert das zweite lokale Zeitsteuersignal zu der gemeinsamen Schnittstellen- und Steuereinheit 302, 
dadurch wird eine Zeitsteuerreferenz fur die T-Maschine 14 geliefert, auf der sie beruht Vorzugsweise ist das 
zweite lokale Zeitsteuersignal phasensynchronisiert mit dera Master-ZeitsteuersignaL Innerhalb des Systems 10 
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operiert bzw. arbeitet jcde zweite lokalc Zeitbasiseinheit 300 der T-Maschine vorzugsweise mit einer identi- 
schen Frequenz, Fachleute werdea erkennen, daS bei einer aJternativen Ausfuhrungsform eine oder mehrere 
zweite lokale Zeitbasiseinheiten 300 bei verschiedenen Frequenzen arbeiten kdnnea Die zweite lokale Zeitba- 
siseinheit 300 wird vorzugsweise realisiert, indem eine herkdmmliche phasensynchronisierte Frequenzumwand- 
lungsschaltung verwendet wird, einschlieBIich einer CLB-basierten phasensynchronisierten Detektionsschal- 
tung. Fachleute werden erkennen, dafl bei einer aJternativen Ausfuhrungsform die zweite lokale Zeitbasiseinheit 
300 als ein Abschnitt eines Taktverteilungsbaumes realisiert werden Iconnte. 

Die geraeinsame Schnittstellen- und Steuereinheit 302 verwaltet den Transfer von Nachrichten zwischen ihrer 
entsprechenden S-Maschine 12 und einer spezifizierten Verbindungs-I/O-Einheit 304, wo eine Nachricht ein 
Koramando bzw. einen Befehl und mogliche Daten enthalt Bei der bevorzugten Ausfuhrungsform kann die 
spezifizierte Verbindungs-I/O-Einheit 304 innerhalb jeglicher T-Maschine 14 oder I/O-T-Maschine 18 sich 
innerhalb oder auBerhalb bezugtich des Systems 10 befinden. Bei der voriiegenden Erfindung ist jeder Verbin- 
dungs-I/O-Einheit 304 vorzugsweise eine Verbindungsadresse zugeordnet, die einzig die Verbindungs-I/O-Ein- 
heit 304 identifiziert Die Verbindungsadressen zur Verbindung der I/O-Einheiten 304 innerhalb einer gegebe- 
nen T-Maschine werden in dem entsprechenden Architekturbeschreibungsspeicher 101 der S-Maschine gespei- 
chert 

Die gemeinsame Schnittstellen- und Steuereinheit 302 empfangt Daten bzw. Befehie von ihrer entsprechen- 
den S-Maschine 12 aber die Speicher-I/O-Leitung 46 bzw. die externe Steuersignalleitung 48. Vorzugsweise 
beinhaltet jeder empfangene Befehi eine Zieiverbindungsadresse und einen BefehJscode bzw. Kommandocode, 
der einen bestimmten Operationstyp spezifiziert, der durchgefuhrt werden soiL In der bevorzugten Ausfuh- 
rungsform beinhalten die Operationstypen, die einzig bzw. eindeutig durch die Kommandocodes bzw. Bef ehlsco- 
des identifiziert werden, folgendes: 1) Datenleseoperationen; 2) Datenschreiboperationen; und 3) Interruptsig- 
naltransfer einschlieBlich Rekonfigurations-Interniptsignaltransfer. Die Zielverbindungsadressen identifizieren 
eine Zielverbindungs-I/O-Einheit 304, zu der Daten und Befehie ubertragen werden soil Vorzugsweise Uber- 
tragt die gemeinsame Schnittstellen- und Steuereinheit 302 jeden Befehl und jegliche in Beziehung stehende 
Daten als einen Satz von Nachrichten auf Paketbasis in einer herkammlichen Art und Weise, und zwar wo jede 
Nachricht die Zieiverbindungsadresse und den Befehiscode enthalt 

Zusatzlich zum Empfang der Daten und Befehie von ihrer entsprechenden S-Maschine 12 empfangt die 
gemeinsame Schnittstellen- und Steuereinheit 302 Nachrichten bzw. Meldungen von jeder der Verbindungs- I/O- 
Einheiten 304, die mit der NachrichtenObertragungsleitung bzw. Nachrichten transferleitung 312 verbunden sind. 
Bei der bevorzugten Ausfuhrungsform wandelt die gemeinsame Schnittstellen- und Steuereinheit 302 eine 
Gruppe von in Beziehung stehenden Nachrichten in eine einzige Befehls- und Datensequenz urn. Falls der Befehl 
auf die DRPU 32 innerhalb ihrer entsprechenden S-Maschine 12 gerichtet ist, gibt die gemeinsame Schnittstel- 
len- und Steuereinheit 302 den Befehl uber die externe Steuersignalleitung 48 aus. Falls der Befehl auf den 
Speicher 34 innerhalb ihrer entsprechenden S-Maschine 12 gerichtet ist, gibt die gemeinsame Schnittstellen- und 
Steuereinheit 302 ein entsprechendes Sp etchers teuersignal uber die externe Steuersignalleitung 48 und ein 
Speicheradressensignal Uber die Speicheradressenleitung 44 aus. Daten werden Ober die Speicher-I/O-Leitung 
46 ubertragen. Bei der bevorzugten Ausfuhrungsform umfaBt die gemeinsame Schnittstellen- und Steuereinheit 
302 eine Schaltung auf CLB-Basis, urn Operationen analog zu jenen, die durch eine konventionelle SCI-Schal- 
tungseinheit durchgefuhrt werden, wie sie durch den ANSI/IEEE-Standard 1596—1992 definiert ist, zu realisie- 
ren. 

Jede Verbindungs-I/O-Einheit 304 empfangt Nachrichten von der gemeinsamen Schnittstellen- und Steuer- 
einheit 302 und ubertragt Nachrichten zu anderen Verbindungs-I/O-Einheiten 304 Ober die GPIM 16, und zwar 
unter Verwaltung der Steuersignale, die von der gemeinsamen Schnittstellen- und Steuereinheit 302 empfangen 
werden. Bei der bevorzugten Ausfuhrungsform basiert die Verbindungs-I/O-Einheit 304 auf einem SCI-Knoten, 
wie durch den ANSI/IEEE-Standard 1596—1992 definiert ist Nimmt man nun Bezug auf die Fig. 14, so ist ein 
Blockdiagramm einer bevorzugten AusfOhrungsform einer Verbindungs-I/O-Einheit 304 gezeigt Die Verbin- 
dungs-I/O-Einheit 304 umfaBt einen Adressendecoder 302, einen Eingangs-FIFO- Puffer 322, einen BypaB- FIFO- 
Puffer 324 und einen Ausgangs-FIFO-Puffer 326 und einen Multiplexer 328. Der Adressendecoder 328 umfaBt 
einen Eingang, der den Eingang der Verbindungs-I/O-Einheit ausbildet, einen ersten Ausgang, der mit dem 
Eingangs-FIFO 322 verbunden ist, und einen zweiten Ausgang, der mit dem BypaB-FIFO 324 verbunden ist Der 
Eingangs-FIFO 322 umfaBt einen Ausgang, der mit der Nachrichtentransferieitung 312 zur Ooertragung von 
Nachrichten zu der gemeinsamen Schnittstellen- und Steuereinheit 302 verbunden ist. Der Ausgangs-FIFO 326 
umfaBt einen Eingang, der mit der Nachrichtentransferieitung 312 zum Empfang von Nachrichten von der 
gemeinsamen Schnittstellen- und Steuereinheit 302, verbunden ist, und einen Ausgang, der rait dem ersten 
Eingang des Multiplexers 328 verbunden ist. Der BypaB-FIFO 326 umfaBt einen Ausgang, der mit einem zweiten 
Eingang des Multiplexers 328 verbunden ist SchlieBlich umfaBt der Multiplexer 328 einen Steuereingang, der 
mit der Nachrichtentransferieitung 312 verbunden ist, und einen Ausgang, der den Ausgang der Verbindungs- 
I/O-Einheit ausbildet. 

Die Verbindungs-I/O-Einheit 304 empfangt Nachrichten bei dem Eingang des Adressendecoders 320. Der 
Adressendecoder 320 bestimmt, ob die Zieiverbindungsadresse, die in einer empfangenen Nachricht spezifiziert 
ist, identisch mit der Verbindungsadresse der Verbindungs-I/O-Einheit 304 ist, in der sie sich befmdet Falls dem 
so ist, leitet der Adressendecoder 320 die Nachricht zu dem Eingangs-FIFO 322 Ansonsten leitet der Adressen- 
decoder 320 die Nachricht zu dem BypaB-FIFO 324. Bei der bevorzugten Ausfuhrungsform umfaBt der Adres- 
sendecoder 320 einen Decoder und eine Datenauswahleinrichtung, die verwirklicht ist, indem IOBs und CLBs 
verwendet werdea 

Bei dem Eingangs-FIFO 322 handelt es sich urn einen konventioneilen FIFO-Puffer, der Nachrichten, die bei 
seinem Eingang empfangen werden, zu der Nachrichtenubertragungsleitung 312 ubertragt. Sowohl der BypaB- 
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FIFO 324 als auch der Ausgangs-FIFO 326 sind herkdmmliche FIFO-Puffer, die Nachrichten, die bei deren 
Eingangen empfangen werden, zu dem Multiplexer 328 ubertragen. Der Multiplexer 328 ist ein herkdmmlicher 
Multiplexer, der entweder eine Nachricht die von dem BypaB-FIFO 324 erhalten wird, oder eine Nachricht die 
von dem Ausgangs-FIFO 326 erhalten wird, zu der GPIM 16 in Obereinstimmung mit einem Steuersignal, das 
5 bei seinem Steuereingang empfangen wird, leitet Bei der bevorzugten Ausfuhrungsform werden sowohl der 
Eingangs-FIFO 322 als auch der BypaB-FIFO 324 und der Ausgangs-FIFO 326 realisiert, indem ein Satz von 
CLBs verwendet wird Der Multiplexer 328 wird vorzugsweise realisiert, indem ein Satz von CLBs und lOBs 
verwendet wird. 

Es wird nun auf die Fig. 15 Bezug genommea Dort ist ein Blockdiagramm einer bevorzugten Ausfuhrungs- 

to form einer I/O-T-Maschine 18 gezeigt Die I/O-T-Maschine 18 umfaBt eine dritte lokale Zeitbasiseinheit 360, 
eine allgemeine Kunden-Schnittstellen- und Steuereinheit 326 und eine Verbindungs-I/O-Einheit 304. Die dritte 
lokale Zeitbasiseinheit 360 umfaBt eine Zeitbasiseinheit, die den Master-Zeitsteuereingang der I/O-T-Maschine 
ausbildet Die Verbindungs-I/O-Einheit 304 umfaBt einen Eingang, der mit der GPIM 16 Qber eine Nachrichten- 
eingangsleitung 314 verbunden ist, und einen Ausgang, der mit der GPIM 16 fiber eine Nachrichtenausgangslei- 

15 tung 316 verbunden ist Die gemeinsame Kunden-Schnittstellen- und Steuereinheit 362 umfaBt vorzugsweise 
einen Zeitsteuereingang, der mit einem Zeitsteuerausgang der dritten lokalen Zeitbasiseinheit 360 Qber eine 
dritte Zeitsteuersignalleitung 370 verbunden ist, einen ersten bidirektionalen Datenport der mit einem bidirek- 
tionalen Datenport der Verbindungs-I/O-Einheit 304 verbunden ist, und einen Satz von Verbindungen zu einer 
I/O-Vorrichtung 20. Bei der bevorzugten Ausfuhrungsform beinhaltet der Satz von Verbindungen zu der 

20 I/O-Vorrichtung 20 einen zweiten bidirektionalen Datenport, der mit einem bidirektionalen Datenport der 
I/O-Vorrichtung 20 verbunden ist, und einen A dress en ausgang, der mit einem Adresseneingang von der I/O- 
Vorrichtung 20 verbunden ist, und einen bidirektionalen Steuerport der mit einem bidirektionalen Steuerport 
der I/O-Vorrichtung 20 verbunden ist Fachleute werden leicht erkennen, daB die Verbindungen zu der I/O-Vor- 
richtung 20 von dem Typ der I/O-Vorrichtung 20 abhangen, mit der die gemetnsam Kunden-Schnittstellen- und 

25 Steuereinheit 362 verbunden ist 

Die dritte lokale Zeitbasiseinheit 360 empfangt das Master-Zeitsteuersignal von der Master-Zeitsteuereinheit 
22 und erzeugt ein drittes lokales ZeitsteuersignaL Die dritte lokale Zeitbasiseinheit 360 liefert das dritte lokale 
Zeitsteuersignal zu der gemeinsamen Kunden-Schnittstellen- und Steuereinheit 362, womit eine Zeitsteuerref e- 
renz fur die I/O-T-Maschine bereitgestellt wird, in der sie sich befindet Bei der bevorzugten Ausfuhrungsform 

30 ist das dritte lokale Zeitsteuersignal mit dem Master-Zeitsteuersignal phasensynchronisiert Die dritte lokale 
Zeitbasiseinheit 360 einer jeden I/O-T-Maschine arbeitet vorzugsweise bei einer identischen Frequenz. Bei einer 
alternativen Ausfuhrungsform konnen eine oder mehrere dritte lokale Zeitbasiseinheiten 360 bei verschiedenen 
Frequenzen arbeiten. Die dritte lokale Zeitbasiseinheit 360 wird vorzugsweise realisiert, indem eine herkdmmli- 
che phasensynchronisierte Frequenzumwandlungsschaltung verwendet wird, die eine phasensynchronisierte 

35 Detektionsschaltung auf CLB-Basis beinhaltet Auf eine Art und Weise, die zu jener fur die ersten und zweiten 
lokalen Zeitbasiseinheiten 30, 300 analog ist, konnte die dritte lokale Zeitbasiseinheit 360 als ein Abschnitt eines 
Taktverteilungsbaumes in einer alternativen Ausfuhrungsform verwirklicht werden. 

Die Struktur und Funktionalitat der Verbindungs-I/O-Einheit 304 innerhalb der I/O-T-Maschine 18 ist vor- 
zugsweise mit jener der zuvor fur die T-Maschine 14 beschriebenen identisch. Der Verbindungs-I/O-Einheit 304 

40 innerhalb der I/O-T-Maschine 18 ist vorzugsweise einer einzigen Verbindungsadresse in einer Art und Weise 
zugeordnet die zu jener fur jede Verbindungs-I/O-Einheit 304 innerhalb einer gegebenen T-Maschine 14 analog 
ist 

Die gemeinsame Kunden-Schnittstellen- und Steuereinheit 362 verwaltet den Transfer bzw. die Obertragung 
von Nachrichten zwischen der I/O-Vorrichtung 20, an die sie gekoppelt ist, und der Verbindungs-I/O-Einheit 

45 304, und zwar wo eine Nachricht einen Befehl und mdgliche Daten enthalt Die gemeinsame Kunden-Schnittstel- 
len- und Steuereinheit 362 empfangt Daten und Befehle von ihrer entsprechenden I/O-Vorrichtung 20. Vorzugs- 
weise beinhaltet jeder Befehl, der von der I/O-Vorrichtung 20 empfangen wird, eine Zi el verbindungsadresse und 
einen Befehlscode, der einen bestimmten Typ von Operation spezifiziert, der durchgefuhrt werden solL Bei der 
bevorzugten Ausfuhrungsform beinhalten die Typen von Operationen, die ausschlieBlich bzw. einzig durch 

50 Befehlscodes identifiziert werden, folgendes: 1) Datenanforderungen; 2) Datentransferbestatigungen; und 3) 
Intermptsignaltransfer. Die Zielverbindungsadresse identifiziert eine Zielverbindungs-I/O-Einheit 304 in dem 
System 10, zu der Daten und Befehle Ubertragen werden so lien. Vorzugsweise QbertrSgt die gemeinsame 
Schnittstellen- und Steuereinheit 362 jedes Kommando bzw. jeder Befehl und jegliche in Bezug stehende Daten 
als einen Satz von Nachrichten auf Paketbasis in einer herkdmmlichen Art und Weise, und zwar wo jede 

55 Nachricht die Zielverbindungsadresse und den Befehlscode enthalt 

Zusatzlich zum Empfang von Daten und Befehien von ihrer entsprechenden I/O-Vorrichtung 20, empfangt die 
allgemeine Kunden-Schnittstellen- und Steuereinheit 362 Nachrichten von ihrer zugeordneten Verbindungs- 
I/O-Einheit 304. Bei der bevorzugten Ausfuhrungsform wandelt die gemeinsame Kunden-Schnittstellen- und 
Steuereinheit 362 eine Gruppe von in Beziehung stehenden Nachrichten in eine einzige Befehls- und Datense- 

go quenz in Obereinstimmung mit den Kommunikationsprotokollen urn, die durch ihre entsprechende I/O-Vorrich- 
tung 20 unterstfitzt werden. Bei der bevorzugten Ausfuhrungsform umfaBt die gemeinsame Kunden-Schnittstel- 
len- und Steuereinheit 362 eine CLB-basierte I/O-Vorrichtungs-Steuereinrichtung, die mit der CLB-basierten 
Schaltung zur Realisierung von Operationen verbunden ist die analog zu jenen sind, die durch eine konventio- 
nelle SCI-Schaltungseinheit durchgefuhrt werden, wie es durch den ANSI/IEEE-Standard 1596— 1992 festgelegt 

65 «st 

Die GPIM 16 ist eine herkdmmliche Verbindungsmasche bzw. Verbindungsvermaschung, die eine Punkt-zu- 
Punkt-Parailelnachrichten-Wegeermittlung zwischen Verbindungs-I/O-Einheiten 304 erleichtert Bei der bevor- 
zugten Ausfuhrungsfonn handelt es sich bei der GPIM 16 urn ein statisches Tc-ary n-cube* bzw. k-n-kubisches 
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Verbindungsnetzwerk auf Verdrahtungsbasis. Nimmt man nun Bezug auf Fig. 16, so ist ein Blockdiagramm einer 
beispielhaften Ausfuhrungsforra einer AJlzweck-Verbindungsniatrix 16 gezeigt In der Fig, 16 handelt es sich bei 
der GPIM 16 um eine toroidale Verbindungsraasche oder Equivalent am ein "k-ary-2-cube' bzw. ein k-2-Kubus 
mit einer AnzahJ von ersten Kommunikationskanalen 380 und einer Anzahl von zweiten Kommunikationskana- 
len 382. Jeder erste ICommunikationskanal 380 beinhaltet eine Anzahl von Knotenverbindungssitzen 384, wie 5 
dies auch bei jedera zweiten Komraunikatiooskanal 382 der Fall ist Jede Verbindungs-I/O-Einheit 304 in dem 
System 10 ist vorzugsweise mit der GPIM 16 derartig verbunden, dafl die Nachrichteneingangsleitung 314 und 
die Nachrichtenausgangsleitung 316 an fortlaufende Knotenverbindungssitze 384 innerhalb eines gegebenen 
Kommunikationskanals 380, 382 angeschlossen sind. Bei der bevorzugten Ausfuhrungsform beinhaltet jede 
T-Maschine 14 eine Verbindungs-I/O-Einheit 304, die rait dem ersten Komraunikationskanal 380, und eine to 
Verbindungs-I/O-Einheit 304, die mit dem zweiten Kommunikationskanal 382 in der oben beschriebenen Weise 
verbunden ist Die gemeinsame Schnittsteflen- und Steuereinheit 302 innerhalb der T-Maschine 14 erleichtert 
vorzugsweise das Leiten von Informationen zwischen ihrer Verbindungs-I/O-Einheit 304, die mit dem ersten 
Kommunikationskanal verbunden ist, und ihrer Verbindungs-I/O-Einheit 304, die mit dem zweiten Kommunika- 
tionskanal 382 verbunden ist Somit erleichtert fur eine T-Maschine 14 mit einer Verbindungs-I/O-Einheit 304, is 
die an den ersten Kommunikationskanal angeschlossen ist, der als 380c bezeichnet ist, und einer Verbindungs- 
I/O-Einheit 304, die mit dem zweiten Komraunikationskanal verbunden ist, der als 382c in Fig. 16 bezeichnet ist, 
diese gemeinsame Schnittstellen- und Steuereinheit 302 der T-Maschine das Leiten vom Informationen zwischen 
diesem Satz von ersten und zweiten Kommunikationskanalen 380c, 382c. 

Die GPIM 16 erleichtert somit das parallele Leiten von mehreren Nachrichten zwischen den Verbindungs- 20 
I/O-Einheiten 304. Fur die zweidimensionaie GPIM 16, die in Fig. 16 gezeigt ist, beinhaltet jede T-Maschine 14 
vorzugsweise eine einzige Verbindungs-I/O-Einheit 304 fur den ersten Kommunikationskanal 380 und eine 
einzige Verbindungs-I/O-Einheit 304 fur den zweiten Verbindungskanal 382. Fachleute werden erkennen, daB 
bei einer Aiisfuhrungsform, bei der die GPIM 16 eine Dimensionalitat aufweist, die groBer als 2 ist, die 
T-Maschine 14 vorzugsweise raehr als zwei Verbindungs-I/O-Einheiten 304 aufweist Vorzugsweise ist die 25 
GPIM 16 als ein k-ary 2-cube bzw. k-2-Kubus mit einer 1 6-Bit-Datenpfadgr6Be realisiert 

Bei der yorhergehenden Beschreibung wurden verschiedene Elemente der vorliegenden Erfindung vorzugs- 
weise realisiert, indem rekonfigurierbare Hardware-Systemeleraente verwendet wurden. Die Hersteller von 
reprogrammierbaren Logikvorrichtungen liefern typischerweise veroffentlichte Richtlinien, um herkommliche 
.. digitale Hardware zu realisieren, indem reprogrammierbare oder rekonfigurierbar Hardware-Systemelemente 30 
: . verwendet werden. ZunTBeispiel beinhaltet das 1994 Xilinx Programmable Logic Data Book (Xilinx, Inc, San 
Jose, GA) als Bemerkungen zur Anwendung bzw. als "Application Notes" das folgende: Application Note XAPP 
005.002 "Register-Based FIFO"; Application Note XAPP 044.00 "High-Perrormance RAM-Based FIFO"; Appli- 
cation Note XAPP 013.001 "Using the Dedicated Cany Logic in the XC 4000"; Application Note XAPP 018.000 
"Estimating the Performance of XC 4000 Adders and Counters"; Application Note XAPP 028.001, "Frequency/ 35 
Phase Comparator for Phase-Locked Loops"; Application Note XAPP 031.000 Using the XC4000 RAM 
Capability"; Application Note XAPP 036.001, "Four- Port DRAM Controller ."; und Application Note XAPP 
039.001, "18-Bit Pipelined Accumulator". Zusatzliches von Xilinx veroffentlichtes Material beinhaltet Merkmale 
aus "XCELL, The Quarterly Journal for Xilinx Programmable Logic Users". Zum Beisptel ist ein Artikel in der 
Ausgabe 14 des dritten Quartals 1994 erschienen, der die Realisierung von schnellen Integermultiplikatoren 40 
detailliert beschreibt 

Bei dem hierin beschriebenen System 10 handelt es sich um eine skalierbare, parallele Computer- Architektur, 
um dynamisch mehrere ISAs zu realisieren. Jede einzelne S-Maschine 12 ist in der Lage, ein gesamtes Computer- 
programm selbst ablaufen zu lass en, und zwar unabhangig von einer ander S-Maschine 12 oder externen 
Hardware-Systemelementen, wie z. R. einem Hostcomputer. Auf jeder individuellen S-Maschine 12 sind mehre- 45 
re ISAs sequentiell in der Zeit wahrend der ProgrammausfOhrung realisiert, und zwar in Antwort auf die 
Rekonfigurations-Interrupts und/oder auf im Programm eingebettete Rekonfigurationsanweisungen. Weil das 
System 10 vorzugsweise mehrere S-Maschinen 12 beinhaltet, werden mehrere Programme vorzugsweise simul- 
tan ausgefuhrt, wo jedes Programm unabhangig sein kann. Da somit das System 10 vorzugsweise mehrere 
S-Maschinen 12 beinhaltet, sind mehrere ISAs simultan (d. h. parallel) zu alien Zeiten, auBer wahrend der so 
Systeminitialisierung oder Rekonfigurierung, realisiert Das heiBt, zu jeder gegebenen Zeit werden mehrere 
Satze von Programminstruktionen simultan ausgefuhrt, und zwar wo jeder Satz von Programminstruktionen 
gemafl einer entsprechenden ISA ausgef Qhrt wird. Jede derartige ISA kann einzig sein. 

S-Maschinen 12 kommunizieren miteinander und mit I/O-Vorrichtungen 20 Ober den Satz von T-Maschinen 
14, der GPIM 16 und jeder I/O-T-Maschine 18. Obwohl jede S-Maschine 12 einen ganzen Computer in sich 55 
selbst darstellt, der zu einem unabhangigen Betrieb in der Lage ist, ist jede S-Maschine 12 in der Lage als eine 
Master-S-Maschine 12 fur and ere S-Maschinen 12 oder das gesamte System 10 zu wirken, Daten zu senden 
und/oder Befehle zu anderen S-Maschinen 12, einer oder mehreren T-Maschinen 16 oder einer oder mehreren 
I/O-T-Maschinen 18 oder einer oder mehreren T/OVorrichtungen 22 zu senden. 

Das System 10 der vorliegenden Erfindung ist somit besonders nQtzlich fur Probleme, die sowohl raumlich als 60 
auch zeitlich in ein oder mehrere datenparallele Subprobleme unterteilt werden kdnnen, z. B.: Bildverarbeitung, 
medizinische Datenverarbeitung, kalibriertes Farbmatching bzw. kalibrierte Farbanpassung, Datenbasisrech- 
nen, Vorlagenverarbeitung, assoziative Suchmaschinen und Netzwerkserver. Bezuglich Rechenproblemen mit 
einem groOen Feld von Operanden existiert ein DatenparaUelismus, wenn Algorithmen verwendet werden 
kannen, urn so eine wirksame Berechnungsgeschwindigkeit anzubieten, die durch parallele Rechentechniken 65 
beschleunigt wird. Datenparallelprobleme besitzen eine bekannte Koraplexitat, naralich von 0(n k ). Der Wert 
von k ist problemabhangig; z. B. k = 2 fur Bfldverarbeitung und k « 3 fur medizinische Datenverarbeitung. Bei 
der vorliegenden Erfindung werden individuelle S-Maschinen 12 vorzugsweise verwendet, um den Datenparal- 
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lelismus bei der Ebene von Programminstruktionsgruppen auszuschdpf en bzw. auszunutzen. Weil das System 10 
mehrere S-Maschinen 12 beinhaltet, wird das System 10 vorzugsweise verwendet, urn den Datenparallelismus 
auf der Ebene von Satzen von gesamten Programmen auszunutzen. 
Das System 10 der vorliegenden Erfindung liefert eine groBe Menge an Rechenleistung, und zwar wegen 
5 seiner Fahigkeit die Instruktionsverarbeitungshardware in jeder S-Maschine 12 voOstandig zu rekonfigurieren, 
um die Rechenfahigkeiten einer derartigen Hardware relativ zu Rechenerfordeniissen zu einem gegebenen 
Augenblick zu optimieren. Jede S-Maschine 12 kann unabhangig von jeder anderen S-Maschine 12 rekonfigu- 
riert werden. Das System 10 behandelt vorteilhaf terweise jeden Konfigurationsdatensatz und folgtich jede ISA. 
als eine programmierte Grenze oder Schnittstelle zwischen Software und der rekonfigurierbaren Hardware, die 
ia hierin beschrieben ist Die Architektur der vorliegenden Erfindung erleichtert zusatzlich die Strukturierung auf 
hoher Ebene von rekonfigurierbarer Hardware, um selektiv die Belange aktueller Systeme in situ anzusprechen, 
einschlieBlich: der Arten und Weisen, in denen eine Unterbrechung die Instruktionsverarbeitung beeintrachtigt; 
des Erfordernisses einer deterministischen bzw. bestinunbaren Verzogerungsantwort bzw. Latenzantwort, um 
Echtzeitverarbeitung und Steuerfahigkeiten zu erleichtern; und des Erfordernisses nach wahlbaren Antworten 
15 zur Fehlerhandhabung. 

Im Gegensatz zu anderen Computer-Architekturen lehrt die vorliegende Erfindung die maximale Verwen- 
dung von Silizium-Systemelementen zu alien Zeiten. Die vorliegende Erfindung liefert ein paralleles Computer- 
system, das auf jede gewunschte GrdBe zu jeder Zeit vergrd&ert werden kann, sogar zu massiv parallelen 
GroBen mit tausenden von S-Maschinen 1Z Derartige Skalierbarkeit bezQglich der Architektur ist mdglich, da 

20 Instruktionsverarbeitung auf S-Maschinen-Basis absichtlich von der Datenkommunikation auf T-Maschinen-Ba- 
sis getrennt ist Dieses Trennungsparadigma bzw. Trennungsbeispiel beziiglich der Befehlsverarbeitung/Daten- 
kommunikation pafit auBerst gut fur datenparalleles Rechnen. Die interne Struktur der S-Maschinen- Hardware 
ist vorzugsweise far den ZeitfluB von Instruktionen optimiert, wahrend die interne Struktur der T-Maschinen- 
Mardware vorzugsweise fur wirksame Datenkommunikation optimiert ist. Der Satz von S-Maschinen 12 und 

25 der Satz von T-Maschinen stellen jeweils einen trennbaren, konfigurierbaren Bestandteil in einer Raum-Zeit- 
Aufteilung einer datenparaUelen Rechenarbeit dar. 

Mit der vorliegenden Erfindung kann zukunftijge rekonfigurierbare Hardware ausgenutzt werden, um Syste- 
me mit sogar noch grdBeren Rechenfahigkeiten zu konstruieren, wahrend die Gesamtstruktur bzw. die zugrun- 
deliegende Struktur, die hierin beschrieben ist, aufrechterhalten wird Mit anderen Worten, das System 10 der 

30 vorliegenden Erfindung ist technologisch skalierbar. Bei scheinbar alien gegenwartigen rekonfigurierbaren 
Logikvorrichtungen handelt es sich ura koraplementare Metalloxidhalbleiter- bzw. "Complementary Metal-Oxi- 
de Semiconductor* (CMOS) -Technologie auf Speicherbasis. Fortschritte in der Kapazitat bzw. Fahigkeit der 
Bauelemente folgen den Trends der Halbleiterspeichertechnologie. In zukOnf tigen Systemen wurde ein rekonfi- 
gurierbares Logikbauelement, das verwendet wird, um eine S-Maschine 12 zu erstellen bzw. zu konstruieren, 

35 eine Aufteilung der internen Hardware-Systemelemente in Obereinstimmung mit der Innenschleifen- und 
Aufienschleifen-ISA-Parameter aufweisen, die hierin beschrieben sind. GrdBere rekonfigurierbare Logikvor- 
richtungen bieten einfach die Fahigkeit an, mehr datenparallele Rechenarbeit innerhalb eines einzigen Bauelele- 
ments durchzuf tthren. Zum Beispiel wurde eine grdBere Funktionseinheit 194 innerhalb der zweiten beispielhaf- 
ten Ausfahrung der DOU 63, wie sie oben unter Bezugnahme auf die Fig- 9B beschrieben ist, sich an grdBere 

40 BildkerngrdBen bzw. "imaging kernel sizes" anpassen. Fachleute werden erkennen, daB die technologische 
Skalierbarkeit, die durch die vorliegende Erfindung bereitgestellt wird, nicht auf Vorrichtungen auf CMOS-Basis 
beschrankt ist, noch daB sie auf Implementationen auf FPGA-Basis beschrinkt ist Somit liefert die vorliegende 
Erfindung eine technologische Skalierbarkeit unabhangig von der bestimmten Technologie, die verwendet wird, 
um eine Rekonfigurierbarkeit oder Reprogrammierbarkeit bereitzustellen. 

45 Nimmt man nun Bezug auf die Fig. 17 A und 17B, so ist ein FIuBdiagramm eines bevorzugten Verfahrens fUr 
skalierbar es, paralleles, dynamisch rekonfigurierbares Rechnen gezeigt Vorzugsweise wird das Verfahren der 
Fig. 17 A und 17B innerhalb jeder S-Maschine 12 in dera System 10 durchgefuhrt. Das bevorzugte Verfahren 
beginnt im Schritt 1000 in der Fig. 17A mit der Rekonfigurationsiogik 104, die einen Konfigurationsdatensatz, 
der einer ISA entspricht, ausltest bzw. wieder aufnimmt Danach konfiguriert im Schritt 1002 die Rekonfigura- 

so tioosiogik 104 jedes Element innerhalb der IFU 60, der DOU 62 und der AOU 64 gemaB dem ausgelesenen 
Datensatz im Schritt 1002, wodurch eine DRPU-Hardware-Organisation fur die Implementation der ISA, die 
gegenwartig betrachtet wird, erzeugt wird Nachfolgend zum Schritt 1002 liest die Interruptlogik 106 die 
Interruptantwortsignale aus, die in dem Architekturbeschreibungsspeicher 101 gespeichert sind, und erzeugt 
einen entsprechenden Satz von Obergangssteuersignalen, die festlegen, wie die gegenwartige DRPU-KonEgu- 

55 ration auf die Unterbrechungen bzw. Interrupts im Schritt 1004 antwortet Die ISS 100 initialisiert nachfolgend 
eine Programmzustandsinformation im Schritt 1006, nach der die ISS 100 einen Instniktionausfuhrungszyklus im 
Schritt 1008 initialisiert. 

Danach bestimmt im Schritt 1010 die ISS 100 oder die Interruptlogik 106, ob eine Rekonfiguration erfordetiich 
ist Die ISS 100 bestimmt, daB die Rekonfiguration in dem Fall erforderlich ist, daB eine Rekonfigurationsanwei- 

60 sung wahrend der Programmausfuhning gewahlt wird. Die Interruptlogik 106 bestimmt, daB eine Rekonfigura- 
tion in Antwort auf einen Rekonfigurationsinterrupt erforderlich ist Falls eine Rekonfiguration erforderlich ist, 
schreitet das bevorzugte Verfahren zum Schritt 1012 fort, in dem eine Rekonfigurationshandhabungseinrichtung 
Programmzustandsinformationen sichert Vorzugsweise beinhalten die Programmzustandsinformationen einen 
Bezug zu dem Konfigurationsdatensatz, der die laufende DRPU-IConfiguratioii entspricht Nach dem Schritt 

65 1012 kehrt das bevorzugte Verfahren zum Schritt 1000 zuruck, um einen nachsten Konfigurationsdatensatz 
derartig auszulesen, wie durch die Rekonfigurationsanweisung oder den Rekonfigurationsinterrupt verwiesen 
wurde. 

F0r den Fall, daB eine Rekonfiguration im Schritt 1010 nicht erforderlich ist, bestimmt die Interruptlogik 106, 
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ob ein Nicht-Rekoofigurattonsinterrupt eine Behandlung im Schritt 1014 erf ordert Falls dem so ist, bestimmt die 
ISS 100 als nachstes im Schritt 1020, ob ein Zustandsttbergang von dem gegenwartigen ISS-Zustand innerhalb 
des Instruktionsausfuhrungszyklus zu dem Interrupt Servicezustand, basierend auf den Obergangssteuersigna- 
len, mdglich ist Falls ein Zustandsttbergang zu dem Interruptservicezustand nicht moglich ist bzw. nicht eriaubt 
ist, schreitet die ISS 100 zu einem nachsten Zustand in dem mstruktionsausfuhrungszyklus fort und kehrt zu dem s 
Zustand 1020 zuriick. FQr den Fall daB die Obergangssteuersignale einen Zustandstibergang von dem gegen- 
wartigen ISS-Zustand innerhalb des Instruktionsausfuhrungszyklus zu dem Interruptservicezustand erlauben, 
schreitet die ISS 100 als nachstes zu dem Interruptservicezustand im Schritt 1024 fort Im Schritt 1024 sichert die 
ISS 100 die Programmzustandsinfonnation und fuhrt Programminstniktionen zur Abarbeitung des Interrupts 
aus. Nachfolgend zum Schritt 1024 kehrt das bevorzugte Verfahren zum Schritt 1008 zuruck, urn den gegenwar- to 
tigen Instniktionsausfuhrungszykius wieder aufzunehmen, falls er nicht vollendet worden ist, oder urn einen 
nachsten Instniktionsau^fQhrungszyklus auszuldsen bzw. zu initialisieren. 

FQr den Fall, daB kein Nicht-Rekonfigurationsinterrupt eine Abarbeitung im Schritt 1014 erfordert, schreitet 
das bevorzugte Verfahren zum Schritt 1016 fort und bestimmt, ob die AusfGhrung des gegenwartigen Pro- 
grarnms vollendet ist Falls die Ausfuhrung des gegenwartigen Programms fortgesetzt werden soil, kehrt das is 
bevorzugte Verfahren zum Schritt 1008 zuriick, urn einen anderen Instruktionsausfuhrungszyklus auszuldsen 
bzw. zu initialisieren. Ansonsten endet das bevorzugte Verfahren. 

Die Lehren der vorliegenden Erfindung unterscheiden sich entscheidend von anderen Systemen und Verfah- 
ren zum reprogrammierbaren oder rekonfigurierbaren Rechnen. Insbesondere ist die vorliegende Erfindung 
nicht Equivalent zu herunterladbaren Mikrocode-Architekturen, weil derartige Architekturen sich im aligemei- 20 
nen auf nicht-rekonfigurierbare Steuereinrichtungen und nicht-rekonfigurierbare Hardware verlassea Die vor- 
liegende Erfindung unterscheidet sich also eindeutig von einem zugeordneten rekonfigurierbaren Prozessor 
bzw. "Attached Reconfigurable Processor" (ARP)-System, in dem ein Satz von rekonfigurierbaren Hardware- 
Systeraeleraenten zu einem nicht-rekonfigurierbaren Hostprozessor oder Hostsystem verbunden wird Ein 
ARP-Apparat hangt beztiglich der Ausfuhrung einiger rYogramniinstruktionen von dem Host ab. Deshalb ist 25 
der Satz an verfQgbaren Silizium-Systemelementen nicht maximal fiber den Zeitrahmen der Programmausfuh- 
rung ausgenutzt, da die Silizium-Systemelernente auf dem ARP-Apparat bzw. dem Host untatig sein werden 
oder inefficient genutzt werden, wenn der Host- bzw. der ARP-Apparat mit Daten arbeitet Im Gegensatz dazu 
handelt es sich bei jeder S-Maschine 12 urn einen unabhangigen Computer, in dem gesamte Programme leicht 
ausgefuhrt werden konnen. Mehrere S-Maschinen 12 fuhren vorzugsweise Programme simultan aus. Die vorlie- 30 
gende Erfindung lehrt deshalb das maximale Ausnutzen von Silizium-Systemelementen bzw. Silizium-Resourcen 
zu alien Zelten, sowohl fur einzelne Programm, die auf einzelnen S-Maschinen 12 ausgefOhrt werden, als auch fur 
mehrere Programme, die auf dem gesamten System 10 ausgefuhrt werden. 

Ein ARP-Apparat liefert eine Rechen-Beschleunigungseinrichtung fur einen bestimmten Algorithmus zu einer 
bestimmten Zeit und ist als ein Satz von Gattern realisiert, die optimal bezfiglich dieses bestimmten Algorithmus as 
verbunden sind. Die Verwendung rekonfigurierbarer Hardware-Systemelemente fur Allzweck-Operationen, 
wie z. B, die Handhabung einer Befehkausfuhrung wird in ARP-Systemen vermiedea Daruber hinaus behandelt 
ein ARP-System nicht einen gegebenen Satz von untereuiander verbunden en Gattern a!s eine leicht wiederver- 
wendbare Resource bzw. als ein leicht wiederverwendbares Systemelement Im Gegensatz dazu lehrt die 
vorliegende Erfindung eine dynamisch rekonfigurierbare Verarbeitungseinrichtung, die fur die effiziente Hand- 40 
habung einer InstruktionsausfOhrung konMguriert ist und zwar gemafi einem InstrukdonsausfUhrungsmodell, 
das am besten an die Rechenerfordernisse zu einem bestimmten Moment angepaBt ist Jede S-Maschine 12 
beinhaltet eine Vielzahl von leicht wiederverwendbaren Systeraelementen, z. B. die ISS 100, die Interruptlogik 
106 und die Abspeicher-/Ausrichtlogik 15Z Die vorliegende Erfindung lehrt die Verwendung von rekonfigurier- 
baren Logik-Systemelementen auf der Ebene von Gruppen von CLBs, IOBs und rekonfigurierbaren Verbindun- 45 
gen eher als auf der Ebene von untereinander verbundenen Gattern. Die vorliegende Erfindung lehrt somit die 
Verwendung rekonfigurierbarer Logikdesign-Konstruktionen hdheren Niveaus, die nutzlich bei der DurchfQh- 
rung von Operationen auf einer gesamten Klasse von Rechenproblemen sind, eher als daB sie ein einziges 
nutzliches Gatterverbindungsschema lehrt, das fur einen einzigen Algorithmus nutzlich ist 

Im allgemeinen sind ARP-Systeme auf die Qbersetzung eines bestimmten Algorithmus in einen Satz von so 
untereinander verbundenen Gattern gerichtet Einige ARP-Systeme streben an, Instruktionen hohen Niveaus in 
eine optimale Hardware- Konfigu ration auf Gatterniveau zu kompilieren bzw. zu ubersetzen, was im aUgemei- 
nen ein "NP-Hard w - bzw. NP-hart-Problem ist Im Gegensatz dazu lehrt die vorliegende Erfindung die Verwen- 
dung eines Korapilers fur dynamisch rekonfigurierbares Rechnen, der rVogramniinstruktionen hohen Niveaus in 
Assemblersprachinstruktionen gemaB einer variablen ISA in einer sehr geradlinigen Art und Weise kompiliert 55 

Ein ARP-Apparat ist im allgemeinen nicht in der Lage, sein eigenes Hostprogramm als Daten zu behandeln 
oder sich selbst zu kontextualisieren bzw. vom {Context abhangig zu behandeln. Im Gegensatz dazu kann jede 
S-Maschine in dem System 10 ihr eigenes Programm als Daten behandeln und sich somit leicht selbst kontextua- 
lisieren bzw. vom Kontext abhangig behandeln. Das System 10 kann sich leicht selbst durch das Ausfuhren seiner 
eigenen Programme simulieren. Die vorliegende Erfindung hat zusatzlich die Fahigkeit, seinen eigenen Kompi- 60 
Ier zu kompilieren. 

Bei der vorliegenden Erfindung kann ein einziges Programm eine erste Gruppe von Instruktionen beinhalten, 
die zu einer ersten ISA gehoren, eine zweite Gruppe von Instruktionen, die zu einer zweiten ISA gehSren, eine 
dritte Gruppe von Instruktionen, die zu einer noch anderen ISA gehoren, usw. Die hierin gelehrte Architektur 
fuhrt jede derartige Gruppe von Instruktionen aus, indem Hardware verwendet wird, die bezuglich der Ausfuh- 65 
rungszeit bzw. Laufzeit konflguriert ist, urn die ISA zu realisieren, zu der die Instruktionen gehoren. Kein System 
oder Verfahren nach dem Stand der Technik bietet ahnliche Techniken an. 

Die vorliegende Erfindung lehrt weiter ein rekonfigurierbares Interruptschema bzw. Unterbrechungsschema, 
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bei welche die InterruptverzSgerungszeit bzw. die Interruptlatenz, die Interruptprazision und die programmier- 
bare Zustandsubergangsfreigabe sich gemaB der ISA andern kann, die gegenw&rtig betrachtet wird Keine 
analogen Techniken wurden in anderen Computersystemen gefunden. Die vorliegende Erfindung lehrt zusiitz- 
lich ein Computersystem mit einer rekonf igurierbaren Datenpfadbitbreite, Adressenbitbreite und rekonflgurier- 
barer Steuerleitungsbreite im Gegensatz zu dem Stand der Technik von Computersystemen. 

Wahrend die vorliegende Erfindung unter Bezugnahme auf gewisse bevorzugte Ausfuhrungsformen beschrie- 
ben wurde, werden Fachleute erkennen, daB verschiedene Anderungen vorgenommen werden kdnnen. Verin- 
derungen und Modifikationen der bevorzugten AusfQhrungsformen werden durch die vorliegende Erfindung 
berettgesteUt,die nur durch die folgenden Anspruche beschrankt ist. 

Zusammenfassend kann man folgendes bemerken: 

Die Erfindung betrifft ein System und ein Verfahren zum skalierbaren, paralleled dynamisch rekonfigurierba- 
ren Rechnen. Ein Satz von S-Maschinen, eine T-Maschine, die zu jeder S-Maschine korrespondierend ist, eine 
Allzweck-Verbindungsmatrix (GPIM), ein Satz von I/O-T-Maschinen, ein Satz von I/O-Vorrichtungen und eine 
Master-Zeitbasiseinheit bilden ein System fur skalierbares paralleies, dynamisch rekonflgurierbares Rechnen. 
Jede S-Maschine ist ein dynamisch rekonfigurierbarer Rechner mit einem Speicher, einer ersten lokalen Zeitba- 
siseinheit und einer dynamisch rekonfigurierbaren Verarbeitungseinheit (DRPU). Die DRPU wird realisiert bzw. 
iraplementiert, indem eine reprogrammierbare Logikvorrichtung verwendet wird, die als eine wstruktionsabruf- 
einheit (IFU), eine Datenoperationseinheit (DOU) und eine Adressenoperationseinheit (AOU) konfiguriert ist, 
von denen jede selektiv wahrend einer Programmausfuhrung in Antwort auf einen Rekonfigurationsinterrupt 
oder der Auswahl einer Rekonfigurationsanweisung, die in einen Satz von Progranmiinstruktionen eingebettet 
ist, rekonfiguriert wird. Jeder Rekonfigurationsinterrupt und jede Rekonfigurationsanweisung nimmt auf einen 
Satz von Konfigurationsdaten Bezug, der eine DRPU-Hardware-Organisation speziflziert, die fur Reaiisierung 
bzw. Implementation einer bestimmten Instruktionssatzarchitektur (ISA)optimiert ist. Die IFU verwaltet Re- 
konfigurarionsoperationen, Instruktionsabruf- und Decodieroperationen, Speicherzugriffsoperationen, und sie 
gibt Steuersignale an die DOU und die AOU aus, urn eine InstniktionsausfOhrung zu erleichtern bzw. zu 
vereinfachen. Die DOU fOhrt Datenberechnungen durch und die AOU fuhrt Adressenberechnungen durch. Bei 
jeder T-Maschine handelt es sich urn eine Datentransfervorrichtung bzw. urn eine Datenubertragungsvorrich- 
tung mit einer gemeinsamen Schnittstellen- und Steuereinheit, einer oder mehrerer Verbindungs-I/O-Einheiten 
und einer zweiten lokalen Zeitbasiseinheit Bei der GPIM handelt es sich um ein skalierbares Verbindungsnetz- 
werk, das eine paraUele JCommunikation zwischen T-Maschinen erleichtert bzw. vereinfacht Der Satz von 
T-Maschinen und die GPIM erleichtert eine paraUele Komraunikation zwischen S-Maschinen. 

AN HANG A 

Instruktionssatz 0 

Eine Allzweck- AuBenschleif en- ISA 



1 JO Architekturmodell des Pro gram mierers 

Dieser Abschnitt stelit die Sicht der ISAO-Architektur aus der Sicht des Programmierers dar, einschlieBlich 
Register, Speichermodell, Aufrufkonventionen bzw. X^dling'-IConventionen von Sprachen hohen Niveaus und 
eines Interna? tmodells. 

1.1. Register 

Die ISAO umfaBt 16 1 6-Bit- Allzweckregister, 16 Adressenregister, zwei Prozessorstarusregister und ein Inter- 
ruptvektorregister. Die Mnemoniks fur die Daten und Adressenregister verwenden hexadezimale Zahlen, 
deshalb handelt es sich bei dem letzten Datenregister um df und bei dem letzten Adressenregister um af. Einer 
der Prozessorstatusregister, nipar (Programmadressenregister fur den nachsten Befehl bzw. "Next Instruction 
Program Address Register"), zeigt zum Abruf auf die Adresse der nachsten Instruktion. Das andere Statusregi- 
ster pew (Prozessorsteuerwort bzw. "Processor Control Word^ beinhaltet Marken bzw. Flags und Steuerbits, 
die verwendet werden, um ProgrammfluB- und Interrupthandhabung zu bewirken. Seine Bits sind in Fig. 2 und 3 
festgelegt Undefinierte Bits sind fur eine zukunftige Verwendung reserviert. Die vier Bedingungsflags bzw. 
Zustandsflags Z, N, V und G werden als Seiteneffekte verschiedener Instruktionen eingesteilt bzw. gesetzt Fur 
eine Zusammenfassung jener Flags bzw. Marken, die durch jede Instruktion beeintrachtigt bzw. beeinflu&t 
werden, siehe Abschnitt ZO. 
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Fig. 1. Register 



dO 



or 

pew 



aO 



af 



J ninar 



10 



15 



20 



1 LVCC 



Das T-(AbIaufverfoIgungsraodus bzw. 'Trace Mode") und das IM-(Interruptmaske bzw. "Interrupt 25 
Mas IO- Flag steuert, wie der Prozessor auf die Interrupts antwortet und warm Traps gehandhabt werden. Das 
Interruptvektorregister ivec halt die 64-Bitadresse der Interruptservicerouttne. Interrupts und Traps werden ira 
Abschnitt 1.4 beschrieben. 

l.ZSpeicherzugriff 30 

Werte, die in dem 64-Bit-Adressenregister gespeichert werden, werden bei Speicher-Lade-/Abspeicherin- 
struktionen verwendet und greifen auf den Speicher in 16- und 64-Bit-Inkrementen zu (siehe Tabelle 4). Bei den 
Adressen handelt es sich um Bitadressen, d. h. Adresse 16 zeigt auch das Wort das bei Bit 16 in dem Speicher 
beginnt Wdrter kdnnen nur an 16-Bit-Grenzen gelesen werden und deshalb werden die vier LSBs eines 35 
Adressenregisters ignoriert, wenn ein Speicher gelesen wird (siehe [I] zur weiteren Diskussion des Konzepts 
K<$*.) 64-Bit- Werte werden als 1 6-Bit- Worte in der "Little-Endian w -Ordnung (die 16 Bits mit der geringsten 
Sigrufikanz werden bei der niedrigsten Adresse gespeichert) gespeichert 

Fig. Z pew- Felder 40 
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1 » 1 z | v , C f 




Cebel 


1 Bedeutung 






T 


Ablaufverfolsungsmodus 






IM0 


Interrupt-MaSkier-Bit 


50 




N 


Negativ 






Z 


Null 






V 


Oberlauf 


55 




c 


Obertrag 





13. Aufrufkonventionen bzw. °CaUing"-Konventionen 

60 

Nach Konvention wird ein Register af als der Stackzeiger durch C- Programme verwendet und ein Register ae 
wird als der Stackrahraenzeiger bzw. "Stack Frame Pointer* verwendet Die Anemoniks sp und fp kdnnen als 
Alias bzw. als Alternate vnam en fur diese Register verwendet werden. ABe anderen Register sind zum allgemei- 
nen Gebrauch frei. Der Stack wachst nach unten. 

ints sind 16 Bits, longs sind 64, wie dies auch void *s sind. int- Werte werden in dO, long- und void*- Werte in aO 65 
zuruckgegeben bzw. returned. dO— d4 und aO— a3 kdnnen durch Funktionen "uberfahren" bzw. "fertiggemachr* 
werden, alle anderen aligemeinen Register mussen liber die Funktionsaufrufe erhalten bleiben. Nachdera in eine 
Funktion eingetreten wurde, zeigt der Stackzeiger zu der Ruckkehradresse bzw. Retumadresse und somit 
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beginnt das erste Argument bei Adresse sp + 64 (Dezimal). 

1.4. Traps und Interrupts 

5 ISAO arbeitet eine Interruptleitung und Software-Traps von zwei Quellen ab. Alle rufen denselben Tlow-of- 
Contror-Transferraechanisnius bzw. SteuerfluB-Transfermechanismus auf, der unten beschrieben wird. 

Extern gibt es einen einzigen INTR-Signaleingang und einen iack-Ausgang. iack wird aktiv, sobald das 
Interrupt- Maskierbit in pew geidscht ist, und zwar indem entweder pew mit einer xpcw-Instruktion zuruckge- 
setzt wird oder pew in seinem originalen Wert durch das Ruckkehren aus dem Interrupt mit einer rti-Instmktion 
to wiederhergestellt wird. Die Zeitmenge, die zwischen dem Signal geben des Interrupts durch die externe Vorrich- 
tung und dem Abarbeiten des Interrupts durch den Prozessor gebraucht wird, hangt von den Instruktionen ab, 
die gegenwartig ausgefQhrt werden und von der Gegenwart von Software-Traps. 

Software-Traps werden entweder durch eine explizite trap-Ins truktion oder durch das Ausfuhren einer 
Instruktion, bei der das T-( trace)- Flag gesetzt ist, ausgeldst In diesem Fall wird eine Steuerung zu der Inter- 
15 ruptserviceroutine Qbertragen, und zwar nach der ersten Instruktion, die dem Setzen des T folgt Wenn eine 
trap-Instruktion ausgefQhrt wird, dann setzt der Prozessor das T-Flag und tritt in die Interruptservice routine ein 
als ob das T-Flag vor der AusfOhrung des Programms gesetzt worden ware. Es werden keine Interrupts 
abgearbeitet, wahrend das T-Flag bzw. die T-Marke gesetzt ist Es werden keine weiteren Traps auftreten, bis 
das T-Flag entweder durch Rucksetzen von pew mit einer xpcw-Instruktion oder durch sein RQcksetzen aus dem 
20 Stack* indem aus dem Interrupt mit einer rti- Instruktion zuruckgekehrt wird, geidscht wird. 

Interrupts werden durch die Gegenwart von akttven Signalen auf dem intr-Externsignal verursacht Falls das 
im-Flag oder das T-Flag gesetzt ist, dann werden die Interrupts raaskiert und der anhangige Interrupt wird 
ignoriert Wenn das im-Flag und das T-Flag geidscht werden, dann wird die Steuerung zu der Interruptservice- 
routine Qbertragen, und zwar nach der ersten Instruktion, die der Bestatigung von intr folgt Nach dem Eintritt in 
25 die Intermptserviceroutine wird das im-Flag durch den Prozessor gesetzt Es werden keine weiteren Interrupts 
auftreten, bis das im-Flag geidscht ist, und zwar entweder durch ein Rucksetzen von pew rnit einer xpcw-Instnk- 
tion oder durch sein RQcksetzen aus dem Stack, indem aus dem Interrupt mit einer rti-Ins truktion zurQckgekehrt 
wird. 

Die Schritte, die von dem Prozessor untemommen werden, wenn ein Interrupt oder ein Trap auftritt, sind die 
30 foigenden: 

1. Alle Instruktionen, die gegenwartig ausgefQhrt werden, werden votlendet 

Z Die Inhalte der 16 Datenregister (do zuerst), der 16 Adressenregister (aO zuerst), pew, ivec und nipar 
werden auf den Stack (auf den durch das Register af gezeigt wird) in dieser Ordnung geschoben bzw. 
35 gepusht Der Wert des af, der auf den Stack gepusht wird, ist sein Wert, bevor das Abarbeiten des Interrupts 

oder des Traps begana 

3. Falls dies ein Interrupt ist, dann wird das Interrupt- Bit in pew besetzt urn weitere Interrupts zu maskieren. 
Falls dies eine trap-Instruktion ist, dann wird das T-Flag gesetzt Falls dies ein Trap ist, der durch den T-Flag 
verursacht wird, dann wird pew nicht geandert 
40 4. nipar wird mit dem Wert in dem ivec- Register geladen. 

5. AusfOhrung von Instruktionen in dem Interrupthandler beginnt dann. 

Nach der Ausfuhrung der rti-Ins truktion werden die foigenden Aktionen unternommen: 

45 1- Die Register werden von dem Stack in der umgekehrten Ordnung, in der sie geschrieben wurden, 

wiederhergestellt bzw. erneut gespeichert 

2. Die Ausfuhrung wird wieder auf genommen. 

Es ist zu bemerken, dafi, falls das Interrupt-Maskierflag nicht bereits geldst worden ist, es durch die rti-Instruk- 
50 tion geidscht wird, da es nach dem Eintritt in die Serviceroutine geidscht bzw. freigegeben war, sofern nicht der 
Wert des pew auf dem Stack modifiziert worden ist Falls das T-Flag durch Ausfuhren einer trap-Ins traktion 
gesetzt worden ist, dann wird es nach der AusfOhrung einer rti aus gleichen GrQnden geidscht Falls der Trap 
durch das T-Flag verursacht wurde, das vor dem Eintritt in die Serviceroutine gesetzt worden ist, dann muB es 
durch die Serviceroutine geidscht werden, urn zu bestatigen, daB der Trap aufgetretea ist Wenn das Interrupt- 
55 Maskierflag auf irgendwelche Weise geidscht worden ist wird das externe Ausgangssignal iack fur einen 
Taktzyklus aktiv, urn der externen Vorrichtung bzw. dem externen Bauelement zu signalisieren, dafi der Inter- 
rupt abgearbeitet worden ist 
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2.0 Instruktionen gruppiert aach Funktion 
Die Notationskonventionen sind: 



Notation 


Bedeutung 


dO.dl 


Zwei Datenregister (die das selbe Register sein konnen) 


a0,al 


Zwei Adressregister (die das selbe Register sein konnen) 


« 


Links-Schiebe-Operation 


» 


Recht-Schiebe-Operation 




N-Brt-Konstante 




vorzeichenbehaftete (Zweierkomplement) N-bit-Konstante 


(dl+l,dl) 


Ein 32- Wert von einem Paar von Daten-Register 


(aO) 


Der Wert bei der Speicherstelle auf die durch das Register aO gezeigt wird 




Architektur-Konstante, die 4 fur IS AO betragt, siehe Referenz [1] * 


AddrWidth 


Architektur-Konstante, die die Bit-Breite eines Adressregisters bezeichnet 

Ihr Wert ist 64 



2.1 Register-Bewegung 
Tabelie 1 
Register-Bewegung 



Maemonik 


Operation 


Flags 


Seite 


mov dO, dl 


dl -dO 


Z.N 


17 


emov aO, al 


al - aO 


Z.N 


13 


xda dO, aO 


aO - (dO+3, dO+2, dO+1, dO) 


KEINE 


20 


xad aO, dO 


(dO+3, dO+2, dO+1, dO) - aO 


KEINE 


20 


xivec al 


al - ivec 


KEINE 


21 


xpcw - 


dO - pew 


KEINE 


21 
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2.2 Logische Ope ratio nen 
TabeIIe2 

Logische Opera tionen. Flags modifiziert: Z, N 



Mnemonik 


Operation 


Rags 


Seite 


and 


dO, 


dl 


dl 


4— 


dl » dO 




Z,N 


10 


or 


dO, 


dl 


dl 


*— 


dl + dO 






17 


xor 


dO. 


dl 


dl 


f- 


dl 3 dO 




Z,N 


20 


mask 


dO, 


dl 


dl 




dl * -dO 




Z,N 


la 


inv 


dO, 


dl 


dl 


*- 


-dO 




T Vf 


1 A. 


si 


dO, 


dl 


dl 


*- 


dl « dO 




2 r N 


IS 


rod 


dl 




dl 




dl << 1 




Z,N,C 


17 


ksl 




dO 


dl 


*— 


dl « K 4 




Z,N 


IS 


esl 


al 




al 




al «' 1 




Z.N 


13 


erocl 


al 




al 




al << 1 | 


C 


Z,N,C 


13 


sr 


dO. 


dl 


dl 


<— 


dl » dO 




Z.N 


13 


ksr 




dl 


dl 


«— 


dl » K A 




Z,N 


16 


esr 


al 




al 


<- 


al » 1 




Z,N 


14 


byxa 


aO , 


dl 


dl 


(dl »{a0 3 


*8) ) 


Z,N* 


10 












-Oxff 









a. Das N-Flag wird durch Bit 7 und nicht Bit 15 gesetzt 
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23 Speicfcer Laden/ Abspeichern 
Tabelle 3 

Laden/Abspeicfaern. Modifizierte Rags: Z, N 



Mnemonik 






Operation 


Seite 


s c 


au t 


al 


(al) t-dO 


18 


sex 


dO, 


al 


al 


al - (l«£C isa ) 


13 








(al) <~d0 




escr 


aO, 


al 


al 


«- al - 

(!<<X Ua ) * (AddrWidth/K isa ) 


14 








(al) <-a0 




Id 


aO. 


dl 


dl 


<- (aO) 


16 


ldf 


aO, 


dl 


dl 
al 


<- (aO) 

«— al * (!<<K lsa ) 


IS 


eldf 


aO, 


al 


al 
al 


<- (aO) 
«- al + 

(l«K isa ) * (AdcrWdti/X isa ) 


12 - 


ldi 


K Lfi . 


dO 


dO 




16 


eldi 




aO 


aO 




*3 
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2.4 Arithroetische Operationen 
Tabelle4 

Aritbmetische Operationen. Modifizierte Flags: Z, N, V, C 



15 



20 



25 



30 



35 



Mneraonik 






Operation 


Seite 


add 


dQ, 


dl 


dl <- 


dl ^ dO 


9 


addc 


dO, 


dl 


dl «- 


dl dO - C 


9 


addq • 


sx 3 , 


dl 


dl *- 


dl + £K 3 


9 


sub 


dQ, 


dl 


dl <- 


dl - dO 


19 


subc 


dO, 


dl 


dl <- 


dl - dO - C 


19 


raul 


dO, 


dl 


(dl+I,dl)«-dl - dO 


17 


uzsul 


dQ r 


dl 


(dl-I, 


dl)*-dl * dO 


20 


div 


dO, 


dl 


<dl-rl. 


dl><- 

(dl+l,dl)/dO 


11 


udiv 


dO, 


dl 


(dl*l,dl)4- 

(dl+!,dl)/dO 


19 


eadd 


dO, 




al t- 


al *• dO 


11 


eiadd 


aO , 


al 


|al *- 


al * aO 


12 


eaddq 


SXg , 


al 


al «- 


al + SK 3 


11 


esub 


dO, 


al 


al *- 


al - dO * 


14 


efsub 


aO, 


al 


ai 


al + aO 


12 


cnrp 


dO, 


dl 


0 


dl - dO 


" 1 


ecrxp 


aO. 


al 


0 <- 


al *• aO 
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45 



SO 
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Z5Steuer-FluB 
Tabelle 5 

Steuer-FluB. Modifizierte Flags: ICeine 



Mnemonik 


Operation 


Seite 


jmp 


addx 54 


| nipar «- addr 54 


1 " 


jcc 

* 


addr £4 


(CC==!) ? nipar *- addr 6jt ; 

nipar f- aipar^(l«SCi JtA ) 


IS 


brc 


CC, SK 13 


• (CC==1) ? nipar «— nipar * S2C L6 
nipar ni.part{l«Kj. sa ) 


10 


jsr 


aO, al 


al t- al - 

(l«X isA ) * (AddrWdth/:< Lsa ) ; 

(al) <- nipar 
nipar «- aO 


IS 




al 


nipar «- (al) ; . 
al f- al + 

{ l«5C isi ) * ( AdcrWdtii/K lsa ) 


13 


cu 


aO | 


siehe Abschnitt 1.4 j 


19 


xti 


1 1 


siehe Abschnitt 1,4 | 


17 


3.0 Alphabet! sche Referenz 



10 



15 



20 



Der Instruktions-Satz fur ISAO 1st unten in alphabetischer Ordnung aufgelistet Die Mnemonik ist mit einer 
kurzen Beschreibung dargestellt Unterhalb dieser beftndet sich die btnare Kodierung der Instruction. Jede Zeile 
ia der binSren Kodierung ist ein 16- Bit-Wort Die beeintrachtigten Flags sind dann aufgelistet Falls nicht anders 
spezifiziert bzw. beschrieben, werden die Flags gesetzt, indem die Daten verwendet werden, die in dem Bestim- 
mungsregister gespeichert sind. Es wird angenommen, daB nipar bereits zu Beginn der Instruktionsausfuhrung 
inkrementiert worden ist SchlieBlich wird eine Textbeschreibung der Insrruktions-Semanflk bereitgestellt 

Die Notations-Konventionen, die in den binaren Kodierungen verwendet werden, werden in der folgenden 
Tabelle beschrieben. Die Bedingung-Codes sind in Tabelle 7 definiert 
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TabeUe6 
Notations- Konventionen 



Notation 


JDGUCULULUg 


ddddd 


lj ea> uin rn un g5-i^> atcnrcgis lct 


adoo, 


Quellen-Datenregister 




Bcsli m mungs-Adressrefflster 




Quellca-Adressregister 


cccc 


Bedingungs-Code 


KKKK 


nicht-vorzeichenbehaftete 4-Bit-Konstante 


SKKKKKKK 


vorzeichenbehaftete 8-Bit-Konstante 


SKKKKKKKKKKKKKKK 


vorzeichenbehaftete 16-Bit-Konstante 


KKKKKKKKKKKKKKKK 


nicht-vorzeichenbehaffcete 16-Bit-Konstante 


add (Add data registers)- Addiert Oatenregister 


1110 dddd„ 


0000 dddd, 



Flags: Z.N, V,C 



Addiert zwei Datenregister, lafit das Ergebnis im Bestimmungsregister. 

addc (Add data registers with carry)- Addiert Datenregister mit Obertrag 



1110 


dddcU 


0010 


dddd, 



Flags: Z,N, V,C 



Addiert zwei Datenregister plus das Carry-Flag bzw. Obertrags-Ftag, lafit das Ergebnis im Bestimmungsregi- 
ster. 

addq (Add quick constant)- Addiere schnell Konstante 



1100 



ddddj 



SKKKKKKK 



Flags: Z, N, V, C 



Addiert ein 8-Bit vorzeichenbehaftete (Zweierkomplement) Konstante zu einem Datenregister, lafit das 
Ergebnis im Register. 
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and (Bitwise and) 


— Bitweises und 




1111 


ddddj 


1000 


dddd, 



Flags: Z, N 



Ffthrt das bitweise UND von zwei Datenregisterdurch, laUt das Ergebnis im Bestimmungs register. 
brCC (Conditional branch) — bedingte Verzweigung 



0000 


0000 


0001 


cccc 


SKKKKKKKKKKKKKKK 



Falls die Bedingung war ist, dann wird (offset < Ki») zu nipar addiert 

bru (Unconditional branch) — unbedingte Verzweigung 



0000 


0000 


0001 


0000 


. SKKKKKKKKKKKKKKK 



10 



15 



20 



25 



30 



35 



Flags: keine 
(offset < fQsa) wird zu nipar addiert 



byte (Byte aiign)-Byte-Ausrichtung 



1101 



dddd. 



1111 



40 



Flags: Z,N 



Verschiebe bedingt 8 Bit nach rechts und maskiere. Wird nach einer Lade-Ins truktion verwendet, um 8-Bit- 45 
Datenworte auszulesen, die von Wort-Offsets gelesen werden. Falls die Adresse, die in dem Quelleu-Adressregi- 
ster enthalten ist, an einer 8-Bit-Grenze ( hat Bit 2 gesetzt) liegt, dann wird der Wert des Datenregisters nach 
rechts um 8 Bit verschoben. Falls die Adresse nicht an einer 8-Bit-Grenze liegt, werden die oberen 8- Bits des 
Registers getdscht 

Merke: Der negative Flag wird mit Bit 7 gesetzt, nicht Bit 15. Dies erleichtert die Vorzeicheu-Ausdehnung von so 
8-Bit-GrdBen. 

cmp (Compare data registers) — Vergleiche Datenregister 



1110 



Flags: Z,N,V,C 



ddddj 



1000 



dddd, 



55 



60 



Setzt Flags zum Grofienvergleich von zwei Datenregister, indem das Quellenregister von dem Bestimmungs- 
register substrahiert wird, beeinflufit nur die Rags. 
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div (Signed 32 by 16 division) — Vorzeichenbehaftete 32-durch-t 6- Division 



1110 



dddd. 



0101 



dddd, 



Flags: Z,N,V,C 



10 Vorzeichenbehaftete Division einer vorzeichenbehafteten 32-Bit-Integer durch eine vorzeichenbehattete 
16-Bit Integer, gibt den vorzeichenbehafteten 16-Bit Quotienten und den Rest zuruck. Der 32-Bit-Dividend wird 
gespeicfaert ("little-endian"), und zwar in zwei aufeinanderfolgenden Registern, die von dem Index des Bestira- 
mungsregister ausgehend beginnen. Der 16-Bit- Divisor ist im Quellenregister bzw. Source-Register. Der Rest 
wird in dem Bestimmungsregister zurGckgegeben, und der Quotiont wird in dem Register nach dem Bestira- 

is mungsregister zurQckgegeben (modulo 16). Ein Oberlauf tritt auf, falls der Quotient mehr als 16-Bits zur 
DarsteHung bendtigt 

eadd (Add data register to address register) — Addiere Datenregister zu Adressregister 



20 



25 



30 



0101 



0010 



dddd, 



Flags:,Z, N, V, C 

Addiert ein Datenregister zu einem Adressenregister, lafit das Ergebnis im Adressenregister. 

eaddq (Add quick constant to address register) — Addiere schnell Konstante zu Adressenregister 



1000 



SKKKKKKK 



35 



Flags: Z,N,V, C 



40 



Addiert eine vorzeichenbehaftete 8-Bit-Konstante zu einem Adressenregister, laBt das Ergebnis in dem 
Adressenregister. 

ecmp (Compare of address registers) — Vergleich von Adressregister 



45 



0101 



0100 



aaaa. 



Flags: Z,N,V;C 



so Setzt Flags zum GrdBenvergleich von zwei Adressregister, indem das Quellenregister von dem Bestimmungs- 
register substrahiert wird, beinfluBt nur die Flags. 

efadd (Add address register to address register) — Addiere Adressregister zu Adressregister 



55 



60 



0101 



0110 



Flags: Z, N, V, C 



Addiert zwei Adressregister, laBt das Ergebnis im Bestimmungsregister. 



65 
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efsub (Substract address register from address register) — Substrahiere Adressregister von Adressregister 



0101 



0111 



Flags: 2, N, V, C 



Substrahiere das Quellenregister von dem Bestimmungsregister, speicher das Ergebnis in dem Bestimmungs- 
register ab. io 

eldf (Extended load forward) — Erweitertes Laden vorwarts 



0110 



1101 



Flags: Z, N 



15 



Post-Inkrement Laden in das Adressregister. Speicher wird von der Adresse gelesen, auf die durch das 
Quellenregister gezeigt wird, und wird in dem Bestimmungsregister plaziert Das Quellenregister wird dann 
tnkrementiert 

eldi (load immediate into adress register) — Lade sofort in Adressregister 



20 



1110 



1000 



0000 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



Flags: Z, N 

Lade 64-Bit-Konstante in ein Adressregister. 

emov (Move address register) — Bewege Adressenregister 



30 



40 



45 



0101 
Flags: 2, N 



1111 



aaaa, 



50 



Bewege den Wert von dem Quellenregister zu dem Besrimmungs-Adressregister. 

erotl (Rotate address register left through carry flag) — Rotiere bzw. verschiebe zyklisch Adressenregister nach 55 

links durch Carry- Flag 



I 0101 

Flags: Z, N, C 



aaaa^j 



1010 



0000 



60 



Schiebe ein Adressregister zu dem linken Bit Das LSB wird durch den Wert des Carry-Flag ersetzt Das MSB 65 
wird in das Carry- Flag am Ende der Instruktxon plaziert 
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esl (Shift address register left) — Schiebe Adressenregister links 



oioi 




1000 


0000 



Flags: 2, N 

Schiebe ein Adressenregister zu dem linken Bit. 

est (shift address register right) — Schiebe Adressenregister rechts 



OIOI 



aaaa^ 



1001 



0000 



Flags: 2, N 

Schiebe ein Adressenregister zu dem rechten Bit. 

est (Store address register) — Speichere Adressenregister 



0110 



1000 



Flags: Z,N 



Speichere aus einem Adressenregister. Der 64-Bit-Wert in dem Quellenregister wird in die Speicherstelle 
geschrieben, auf die durch das Bestimmungsregister gezeigt wird Der Wert wird als vier 16-Bit-Worter, die in 
der "littIe-endian M -Ordnung plaziert sind, geschrieben. 

estr (Extended store reverse) — Erweiterte Speicherumkehrung 



0110 



1110 



Flags: Z,N 



Pra-dekreraent-speichern aus Adressenregister. Das Bestimmungsregister wird dekrementiert und dann wird 
der Wert in dem Quellenregister in die Speicherstelle geschrieben, auf die durch das Bestimmungsregister 
gezeigt wird. Der Wert wird als vier 16-Bit- Wdrter geschrieben, die in nittle-endian"-Ordnung plaziert sind. 

esub (Subsfract data register from address register) — Substrahiere Datenregister von Adressregister 



1110 


aaaa^ 


0010 


dddd, 



Flags: Z,N,V,C 

Substrahiert ein Datenregister von einem Adressenregister, laQt das Ergebnis im Adressregister. 





inv (Bitwise inverse] 


— Bitweise invers 




1111 


dddd* 


0101 


dddd, 



Flags: 2, N 

Plaziert das bitweise Inverse des Quellenregisters in das Bestimmungsregister. 
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jCC (Conditional jump) — Bedingter Sprung 



0000 



0000 



0000 



cccc 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



10 



is 



20 



Flags: Keine 

Bedingter Sprung zu Absolutadressen. Siehe Tabelle 7 fur Bedingungscode-Bit-Definitionen. 

jmp (Unconditional jump) — Unbedingter Sprung 



0000 



0000 



0000 



0000 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



KKKKKKKKKKKKKKKK 



Flags: Keine 

Unbedingter Sprung zu Absolut- Adresse. Dasselbe wie jCC mit Bedingung "immer". 

jsr (Jump to subroutine) — Springe zu Unterprogramm 



Flags: Keine 



0001 




0000 





25 



30 



35 



40 



45 



Das Bestimmungsregister wird zuerst inkrementiert, dann wird das gegenwartige nipar (zeigt zu der nachsten 
Adresse) unter der Adresse abgespeichert, auf die durch das Bestimmungsregister (ublicherweise der Stackpoin- 
ter) gezeigt wird nipar wird dann mit der Adresse in dem Quellertregister geladen, bevor die nachste Instruktion 
geholt bzw. abgerufen wird so 

ksl (Shift left by constant) — Schiebe links urn Konstante 



1101 


dddd< 


1000 


KKKK 



Flags: Z,N 

Schiebe ein Datenregister ura eine konstante Anzahl von Bits nach links. 



55 



60 



65 
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ksr (Shift right by constant) — Schiebe rechts urn IConstante 



20 



5 


1101 


ddddt 


1001 


KKKK 




Flags: Z,N 








io Schiebe ein Datenregister urn eine konstante Anzahl von Bits nach rechts. 

Id (Load data register) — Lade Datenregister 




15 


0110 


ddddrf 


0001 





Flags: Z,N 



Lade ein Datenregister aus dem Speicher. Der Wert, auf den durch das QuelienadreBregister gezeigt wird, 
wird in das Bestimmungsdatenregister geladen. 

Idf (Load forward) — Lade vorwarts 



0110 


ddddd 


0101 





30 



Flags: Z, N 



Post-inkrement-laden in Datenregister. Speicher wird von der Adresse gelesen, auf die durch das Quellen- 
adressenregister gezeigt wird, und wird in das Bestimmungsdatenregister plaziert- Das Quellenregister wird 
35 dann inkrementiert 

Idi (Load immediate) — Lade sofort 



40 


0111 


dddd,, 


0000 


0000 




KKKKKKKKKKKKKKKK 



45 



50 



55 



60 



65 



Flags: Z, N 

Lade einen 16-Bit-Sofort-Wert bzw. einen 16-Bit-Direkt-Wert in ein Datenregister. 

mask (Bitwise mask opera tion)-Bitweise Maskier-Operation 



1111 



ddddj 



0100 



dddd, 



Flags: Z,N 



Das Bestimmungregister wird durch das bitweise Inverse des Quellenregisters ersetzt, das rait dem Besrim- 
mungsregister gegrundet wird. 



mov (Move data register) — Bewege Datenregister 



1111 



Flags: Z, N 



dddd* 



1010 



dddd, 



Der Wert in dem Queliendatenregister wird in das Bestimmungsdatenregister plaziert 
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mul (Signed 16 by 16-bit multiply)- Vorzeichenbehaftete 16 mit 16-Bit-Multiplikation 



1110 



dddd* 



0100 



dddd, 



Flags: Z,N,V,C 



Das Ergebnis der Multiplikation des Wertes in dem Quellenregister mit dem Wert in dem Bestimmungsregi- 10 
ster wird gespeichert (Tittle-endian'3, und zwar in den zwei aufeinanderfolgenden Regis tern, die mit dem 
Bestimraungsregister beginnen. 



or (Bitwise or) — Bitweises oder 



1111 


dddd* 


1110 


dddd, 



Flags: Z,N 



15 



20 



FQhrt das bitweise ODER bzw. OR von zwei Datenregistern durch, laBt das Ergebnis in dem Bestimniungsre- 
gister. 

rod (Rotate data register left through carry flag) — Rotiere bzw. verschiebe zyklisch Datenregister links durch 

Carry-Flag 



25 



U01 


dddd< 


1010 


0000 



30 



Flags: Z,N,C 



Schiebe ein Datenregister zu dem linken Bit Das LSB wird durch den Wert des Carry-Flag ersetzt Das 
ursprUngliche MSB wird in dem Carry-Flag am Ende der Instruktion plaxiert 

rti (Return from interrupt) — Return vom Interrupt 



0001 


flaggy 


10001 


0000 



Flags: Z, N, V, C 

Siehe Abschnitt 1.4. Das Quellenregister bzw. Sourceregister wird als Stack-Zeiger verwendet 
rts (Return from subroutine) — RQckkehr von Unterprogramm 



0001 



Flags: Keine 



0001 



0000 



40 



45 



50 



55 



Keine Kehre von Unterprogramm zurflck. nipar wird aus der Speicherstelle geladen, auf die durch das 
Bestimniungsregister (Gblicherweise der Stack-Zeiger) gezeigt wird. Das Bestinunungsregister wird dann inkre- 
mentierL 60 

si (Shift left) — Schiebe links 



J 1101 
Flags: Z,N 



dddd* 



0000 



dddd, 



65 
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Das Bestimmungsregister wird links urn die Anzahl von Bits verschoben, die durch den Wert des Quellenregi- 
ster spezifiziert smd. 

sr (Shift right) — Schiebe rechts 



1101 



ddddj 



0001 



dddd, 



to 



Flags: Z,N 



15 



Das Bestimmungsregister wird rechts urn die Anzahl von Bits verschoben, die durch den Wert des Quellenre- 
gisters spezifiziert sind. 

st (Store) — Speichern 



20 



0110 



dddd* 



Flags: Z,N 



0000 



25 Speichere aus einem Datenregister. Der Wert in dem Quellenregister wird zu der Speicherstelle geschrieben, 
auf die durch das Bestimmungsregister gezeigt wird. 

str (Store reserve) — Speicher umgekehrt 



30 



35 



0110 



ddddj . 



Flags: Z, N 



0110 



aaaa, 



40 



Pra-dekrement-speichern aus Datenregister, Das Bestimmungregister wird dekrementiert und dann wird der 
Wert in dem Quellenregister in die Speicherstelle geschrieben, auf die durch das Bestimmungsregister gezeigt 
wird. 

sub (Substract data register from data register) — Substrahiere Datenregister von Datenregister 



1110 



45 



dddd* 



0001 



dddd, 



Flags: Z, N, V, C 



Substrahiere das Quellenregister von dem Bestimmungsregister, speichere das Ergebnis in dem Bestimraungs- 
50 register. 

subc (Substract with carry) — Substrahiere mit Cany bzw. Obertrag 



55 



1110 



dddd* 



001 r 



dddd, 



Flags: 2, N, V, C 



60 



Substrahiere das Quellenregister von dem Bestimmungsregister, dann substrahiere das Carry-Bit, wobei das 
Ergebnis in dem Bestimmungsregister gespeichert wird 



65 
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trap (Unconditional trap) — Unbedingter Trap 



0011 



0000 



0000 



Flags: Keine 



Fuhre Interrupt-Handler aus. Siehe Abschnitt 1.4. Das Bestimmungsregister wird als der Stack-Pointer ver- io 
wendet 

udiv (Unsigned 32 by 16-bit division) — Nicht-vorzeichenbehaftete 32 durch 16- Bit Division 



1110 



dddd* 



0111 



ddd<^ 



Flags: Z,N,V,C 



Nicht-vorzeichenbehaftete Division einer 32-Bit-lnteger durch eine vorzeichenbehaftete 16-BitInteger, wobei 
der vorzeichenbehaftete 16-Bit-Quotient und -Rest zuruckgegeben wird Die 32 Bits werden in zwei aufeinander 
folgenden Registers beginnend von dem Index des Bestimmungsregisters, gespeichert (Tittle endian"). Der 
Divisor ist in dem QueUenregister. Der Rest wird in das Bestimmungsregister zuruckgegeben und der Quotient 
wird in das n&chste Register nach dem Bestimmungregister zuruckgegeben. Ein Oberlauf tritt auf; falls der 
Quotient mehr als 1 6-Bit zum Darstellen erfordert 

umul ( Unsigned 16 by 16-Bit-Multiplikation) — Nicht-vorzeichenbehaftete 16 mit 16- Bit Multiplikation 



15 



20 



1110 



dddd* 



Flags: Z, N, V,C- 



0110 



dddd, 



30 



35 



Das Ergebnis der Multiplikation des Werts in dem QueUenregister mit dem Wert in dem Bestimmungsregister 
wird gespeichert (Tittle- endian"X und zwar in zwei aufeinander folgende Register beginnend rait dem Bestim- 
mungsregister. 40 

xad (Transfer address register to data register) — Obertrage Adressenregister zu Datenregister 



0101 



ddddtf 



1101 



45 



Flags: Keine 



Obertrage den Wert in dem Quellenadressregister zu vier aufeinander folgende Datenregister beginnend mit 
dem Bestimmungsregister. Der Wert wird "little-endian-"gespeichert und die Bestimmungsregisteradresse wird 
modulo 16 berechnet,so daB das Bestimmungsregister jedes Register sein kann. 

xda (Transfer data register to address register) — Obertrag Datenregister zu Adressenregister 



50 



55 



0101 



1100 



dddd^ 



Flags: Keine 



60 



Obertrag ein en "little-endian*-64-Bit-Wert in vier aufeinanderfolgende Datenregister in das Bestimmungs* 
adressenregister. Die Quelienregisteradresse wird modulo 16 berechnet, so daB das Bestimmungsregister jede 65 
Integer sein kann. 
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xor (Bitwise exclusive or) — Bitweises exklusives Oder 



1111 


dddda 


0110 


dddd, 



Flags: Z,N 



FOhrt das bitweise exklusive ODER bzw. OR bezfiglich zwei Datenregistern durch, laBt das Ergebnis 
Bestimraungsregister. 

xpcw (Exchange processor control word) — Tausche Prozessor-Steuerwort 



0100 


dddd,, 


1010 


0000 



Flags: Alle 

Der Wert in dem QueUendatenregister wird durch das pew-Register ausgetauscht 

xivec (Exchange interrupt vector) -Tausche Interrupt-Vektor 



0101 




0111 


0000 



Flags: Alle 



Der Wert in dem Quellenadressregister wird mit dem ivec-Register ausgetauscht. 

4.0 Bedingungs-Codes 

Die Bedingungs-Code-Opcode-Unterfelder verwenden die Werte der folgenden Tabelle: 

Tabelle7 
Bedingungs-Codes 



Mne. 


Code 


Bedeutung 


Gleichung 




0001 


| gleich 


z 




0010 


1 nicht gleich 






0011 


! gFofter als 


z--(n ev) 


lz 


0100 


j kleiner als 




ge 


0101 


I grofler oder gteichj -(N ©v) 


le 


0110 


keteiner oder gleich 


! Z | (NOV) 


p 


0111 


| positiv 


1 


n 


1000 


1 nesativ 


1 » 


gcu 


1001 


groBer als, nicht 
Ivorzeichenbehaftet 


-c-z 


vc 


1010 


lOberlauf loschen 


1 


vs 


1011 


lOberlaiif setzen 


1 


cc 


1100 


[Obertrag loschen 


1 -c 


cs 


| 1101 


lObertrae setzen 


1 c 
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AnhangB 
Instruktionssatz 1 

Eine gepipelinte Multiplikations-AkkumuJier-ISA 5 

ISA1 gepipelinte Faltungsmaschine fur XC 4013 

Einfuhrung 10 

ISA1 ist ein gepipelinte Mdtiplikadons-Akkumulator-Array, das zu 4 simultanen MultiplikationsAkkumuIa- 
tionen pro Instruktionszyklus in der Lage ist. Es gibt 8 8- Bit Datenregister (xdO— xd3 & ydO— yd3), einen fur 
jeden Eingang zu den vier 8-Bit-X-8-Bit-MuItiplizierern. Die vier Multiplizierer werden fiber ein gepipelinetes 
Addier- Array summiert, bis eine engultige 1 6-Bit-Summe herauskommt, und zwar wo bis zu vier 16-Bit-Register is 
das Ergebnis (raO— m4) speichern werden konnea Die Architektur der ISA1 vermutet einen FluB-durch- Batch- 
Verarbettungszykius mit Hauptspeicher. FQr sich genommen gibt es keinen Feedback-Pfad bzw. Rfickfuhr-Pfad 
durch den Multiptikadom-Akkumulator-Datenpfad, um akkumuiierte Ergebnisse wieder aufzuarbeiten, weil die 
Betonung auf den Speicher-DatenfluBraten IiegL Es ist nichts vorgesehen fttr Oberlauf-Skalierung oder erwei- 
terte EndOchkeits-Akkumuiierungen; ISA1 vermutet daB die Koeffizienten, die fur Faltungs-Filtern verwendet 20 
werden, nicht mehr als 16-Bit-Ergebnis-Endlichkeiten ffir alle Datensatze hervorbringen. Das Multiplikations- 
Array nimmt 8-bit-2er-KompIement-Datenerngange an underzeugt ein 16-Bit-2er- (Complement- Ergebnis. 

Speicherzugriff wird durch zwei 64-Bit-Addressenregister (aO & al) verwaltet bzw. gehandhabt, die als 
miteinander vertauschbare Queilen- und Bestimmungsregister gedacht werden konnea ProgrammfluB wird 
durch das Standard-64-Bit-NIPAR-Register verwaltet und ein 64-Bft-Interrupt-Vektor-Register (IVEQ wird f Or 25 
einen einzelnen Interrupt, wie z. B, einen Frame- oder Datenfertig-Interrupt, untersttitzt 

Der Instruktionssatz von ISA1 ist sehr klein und auf 16-Bitwort-GroBe ausgerichtet, die mit der KisA=*4-Spei- 
cher-Organisation fur den AuBenschleifen-Prozessor ISAO zusammenpaBt. Bis zu 7 Arithmethikoperationen 
k5nnen in einem einzigen Taktzyklus mit ISA1 sofort ausgefiihrt bzw. beispielhaft durchgefuhrt werden, und die 
Implementation halt eine Ergebnisrate von eins pro Takt Qber ein schraales Fenster von Takten aufrecht, und 30 
zwar mit der Fahigkeit neue Quell- oder Bestimmungsadressen zu indizieren und Registerdaten aus oder zu 
einem Speicher zu bewegen, und zwar parallel mit einer Berechnung. 



35 



ISA1 Instruktionssatz 
Datenbewegung 
Id(reg-vector) 

Jeder von bis zu 14 Regis tern wird sequenuell aus dem Speicher geladen, und zwar gemaB 14-Bit-Bitmap-reg- 40 
vector, der rechts-justiert im Instruktionswort enthalten ist 

st (reg-vector) 

Jedes von bis zu 14 Register wird sequentiell in einen Speicher gespeichert, und zwar gemaB einem 14-Bit-Bit- 45 
map-reg-vector, der rechts-justiert in dem Instruktionswort enthalten ist. 

Id (ivec-data) 

Die 64-Bitadresse, die dieser Instruktion folgt, wird in das IVEC-Register geladen, wahrend NIPAR+ °5,um 50 
auf die nachste auszufuhrende Instruktion zu zeigen. 

Programm-Steuerung 

jmp(nipar-data) 55 

Die 64-Bit-Adresse, die dieser Instruktion folgt, wird in das NIPAR-Register geladen, wodurch auf die nachste 
auszufuhrende Instruktion gezeigt wird. 

Arithmetik so 
mac (m-reg) 

Das Multiplikations-Ergebnis- Register, auf das durch den 2-Bit-m-reg-Code gezeigt wird, erapfangt das 
Produkt und die Sum me (xd0*yd0) + (xdl # yd!) + (xd2 # yd2) +(xd3*y<J3). 65 
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macp (s-vec, d-vec) 

Das Multiplikations-Ergebnis-Register, auf das durch 2-Bits des 4-Bit-d-vec -Codes gezeigt wird, empfangt das 
Produkt und die Summe (xdO*ydO) + (xdl # ydl) + (xd2*yd2) + (xd3*yd3). Ein anderes Bit des d-vec-Codes 

5 enabelt selektiv eine Speicher-Schreiboperation dieses Ergebnis-Registers bei Adresse (al) bzw. gibt diese frei, 
wahrend das ubrige Bit des d-vec-Codes auswahlt, ob das Adressenregister al inkrementiert wird oder nichL Der 
8-Bit-s-vec wird in vier 2-Bit-Gruppen aufgeteilt, die sukzesstv fQr die Datenregister xd0-xd3 speziHzieren bzw. 
vorgeben, ob eine Leseoperation aus dem Speicher bei Adresse (aO) auftreten soil und ob das Adressenregister 
aO inkrementiert werden solL Falls Lese- oder Schreiboperationen spezinziert bzw. vorgegeben sind, werden sie 

io parallel mit der Multiplikation durchgefuhrt Die Software muB der gepipelineten Ausrichtung der Instruktions- 
verarbeitung bezQglich Batches bzw. Blocken von Daten Rechnung tragen, die vora Speicher gelesen werden 
und im Speicher gespeichert werden. 



15 



Rekonfiguration 
reconf (ISA-vector) 



ISA1 wird de-kontextet und die S-Maschine wird fQr die ISA rekonfigunert, die durch das ISA-vector-Bitfeld 
in der Instruktion ausgewahlt ist 

20 



30 



40 



45 



50 



55 



60 



65 
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BIock-Diagranun von ISA1 — Gepipelinete Faltungsmascbine fur XC4013 
Speicher-Datenbus 



i 
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Patentanspruche 

I. Dynamisch rekonfigurierbare Verarbeitungseinheit zum Ausfuhren von Programminstruktionen, urn 
Daten zu verarbeiten, wobei die dynamisch rekoafigurierbare Verarbeitungseinheit einen Eingang, einen 
Ausgang und eine veranderbare interne Hardware-Organisation umfaBt, die selektiv wahrend der Ausfuh- 
rung einer Sequenz von Programminstruktionen zwischen einer ersten Hardware- Architektur, die Instruk- 
tionen von einem ersten Instruktionssatz ausfuhrt, und einer zweiten Hardware-Architektur, die Instruktio- 
nen eines zweiten Instniktionssatzes ausfuhrt, veranderbar ist, wobei die dynamisch rekonfigurierbare 
Verarbeitungseinheit, wenn sie als die erste Hardware-Architektur konflguriert ist, auf eine Rekonfigura- 
tionsinstruktion anspricht, urn die interne Hardware-Organisation der dynamisch rekonfigurierbaren Ver- 
arbeitungseinheit zu verandem, die als die zweite Hardware-Architektur konflguriert werden solL 



60 



65 
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2. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die Rekonfigurauonsin- 
struktioa eine der Instruktionen in dem ersten Instruktionssatz ist 

3. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die Rekonfigurationsin- 
struktion ein Teil einer anderen Instruktion ist und die Ausfuhrung der Rekonfiguradonsiiistruktion von 
Daten abhangt die in Registern der dynamisch rekonfigurierbaren Verarbeitungseinheit gespeichert sind 

4. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, die weiter folgendes umfaBt: eine 
zweite rekonfigurierbare Verarbeitungseinheit mit einem Eingang, einem Ausgang und einer veranderba- 
ren internen Hardware-Organisation, die selektiv wahrend der Ausfuhrung einer Folge von Programmin- 
struktionen zwischen der ersten Hardware-Architektur, die Instruktionen von dem ersten Instruktionssatz 
ausfuhrt, und der zweiten Hardware-Architektur, die Instruktionen von dem zweiten Instruktionssatz 
ausfuhrt, veranderbar ist, wobei der Eingang der zweiten rekonfigurierbaren Verarbeitungseinheit mit dem 
Ausgang der dynamisch rekonfigurierbaren Verarbeitungseinheit verbunden ist und der Ausgang der 
zweiten rekonfigurierbaren Verarbeitungseinheit mit dem Eingang der dynamisch rekonfigurierbaren Ver- 
arbeitungseinheit verbunden ist 

5. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 4, bei welcher die dynamisch rekonfi- 
gurierbare Verarbeitungseinheit unabhangig von einer Rekonftguration der zweiten rekonfigurierbaren 
Verarbeitungseinheit dynamisch rekonfigurierbar ist 

6. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher es sich bei der ersten 
Hardware-Architektur urn einen seriellen Instruktionsprozessor bzw. eine serieile Instruktionsverarbei- 
tungseinrichtung handelt und bei der zweiten Hardware-Architektur urn einen paraOelen Instruktionspro- 
zessor bzw. eine paraileie Instnikdonsverarbeitungseinrichtung. 

7. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die veranderbare 
interne Hardware-Organisation der dynamisch rekonfigurierbaren Verarbeitungseinheit eine Instruktions- 
abrufeinheit mit einem Dateneingang, einem ersten Steuerausgang und einem zweiten Steuerausgang 
umfaBt, um InstmktionsausfQhrungsoperationen innerhalb der dynamisch rekonfigurierbaren Verarbei- 
tungseinheit sequentiell zu ordnen, wobei der Dateneingang mit einem Datenport eines Speichers verbun- 
den ist. 

8. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 7, bei welcher die Instruktionsabruf- 
einheit weiter folgendes aufweist: 

einen Architekturbeschreibungsspetcher mit einem Ausgang, wobei der Architekturbeschreibungsspeicher 
einen Satz von Architekturbeschreibungssignalen einschlieBlich eines Interniptantwortsignals speichert, 
das eine Art und Weise spezifiziert, in der die dynamisch rekonfigurierbare Verarbeitungseinheit auf ein 
Interruptsignal antwortet, wenn sie konfiguriert ist, um eine Instruktionssatz-Architektur zu verwirklichen 
bzw. zu implementieren; 

eine Instruktionszustandsfolgesteuereinheit bzw. ein Instruktionszustands-Sequenzer mit einem Eingang 
und einem Ausgang, um einen Instruktionsausfuhrungszyklus und einen Obergang zwischen einem Instruk- 
tionsabrufzustand, einem Instruktionsdecodierzustand, einem Imtruktionsausfuhrungszustand und einem 
Schreib-zuruck-Zustand zu steuern; und 

eine Interniptzustandsmaschine mit einem Eingang und einem Ausgang, um ein Obergangssteuersignal zu 
erzeugen, das einen Zustand, innerhalb des Instruktionsausfuhrungszyklus spezifiziert, fur den ein Ober- 
gang zu einem Interruptservicezustand erlaubt ist wobei der Eingang der Interruptzustandsmaschine mit 
dem Ausgang des Architekturbeschreibungsspeickers verbunden ist der Ausgang der Interruptzustands- 
maschine mit dem Eingang der Instruktionszustands-Folgesteuereinheit bzw. dem Instruktionszustands-Se- 
quenzer verbunden ist 

9. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die veranderbare 
interne Hardware-Organisation der dynamisch rekonfigurierbaren Verarbeitungseinheit eine Datenopera- 
tionseinheit mit einem Datenport und einem Steuereingang umfaBt um Operationen bezuglich der Daten 
durchzufuhren, wobei der Datenport der Datenoperationseinheit mit dem Datenport des Speichers verbun- 
den ist und der Steuereingang verbunden ist, um Steuersignale zu empfangen. 

10. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 9, bei welcher die Datenoperations- 
einheit folgendes umfaBt: 

einen Schalter mit einem Datenport, einen Steuereingang, einen Ruckfuhr- bzw. Feedbackeingang und 
einen Ausgang, um selektiv Daten zwischen dem Datenport, dem RQckfuhr- bzw. Feedbackeingang und 
dem Ausgang zu leiten, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist 
und der Steuereingang des Schalters verbunden ist, um Steuersignale zu empfangen; 
eine Abspeicher-/Ausrichteinheit mit einem Eingang, einem Ausgang und einer Steuereinheit, um Daten zu 
speichern, wobei der Eingang der Abspeicher-/Ausrichteinheit mit dem Ausgang des Schalters verbunden 
ist und der Steuereingang der AbspeicherVAusrichteinheit verbunden ist, um Steuersignale zu empfangen; 
und 

eine Datenoperationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, um Datenbe- 
rechnungen durchzufuhren, wobei der Eingang der Datenoperationsschaltung mit dem Ausgang der Ab- 
speicher-/Ausrichteinheit verbunden ist, der Ausgang der Datenoperationseinheit mit dem Ruckfuhr- bzw. 
Feedbackeingang des Schalters verbunden ist und der Steuereingang der Datenoperationslogik verbunden 
ist, um Steuersignale zu empfangen. 

1 1. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 10, bei welcher die Abspeicher-/Aus- 
richteinheit rekonfigurierbar ist und selektiv als eine aus der Gruppe von einem Speicher mit wahlfreiem 
Zugriff bzw. ein RAM und einem gepipelineten Register bzw. FlieBbandregister konfiguriert werden kann, 
und zwar in Antwort auf Steuersignale fur eine entsprechende Instruktionssatz -Architektur. 
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12. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 10, bei welcher entsprechend Signa- 
len die Date nope ratio nseinheit rekonfigurierbar ist und selektiv als erne aus der Gruppe von einer arithme- 
tische Logikeinheit und einer gepipelineten Funktionseinheit bzw. FlieBband-Funktionseinheit konfiguriert 
werden kann, und zwarin Antwort auf Steuersignale fur eine entsprechende uistniktionssatz-Architektur. 

13. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 1, bei welcher die veranderbare 5 
interne Hardware-Organisation der rekonfigurierbaren Verarbeitungseinheit eine Adressen-Operations- 
einheit mit einem Steuereingang, e in era Adresseneingang und einem Ausgang urnfaBt, urn Operationen 
bezugiich Adressen durchzufQhren, wobei der Adresseneingang mit dem Datenport eines Speichers ver- 
bunden ist und der Ausgang der Adressen-Operationseinheit mit einem Adresseneingang des Speichers 
verbunden ist, und der Steuereingang der Adressen-Operationseinheit verbunden ist, urn Steuersignale zu 10 
empfangen. 

14. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 13, bei welcher die Adressen-Opera- 
tionseinheit folgendes umfafit: 

einen Schalter mit einem Datenport, einen Steuereingang, einen Ruckfuhr- bzw. Feedbackeingang und 
einen Ausgang, urn selektiv Adressen zwischen dem Datenport, dem Ruckfuhr- bzw. Feedbackeingang und 15 
dem Ausgang zu leiten bzw. zu fuhren, und zwar in Antwort auf ein Steuersignai, das bei dem Steuereingang 
empfangen wurde, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist; 
eine Abspeicher-ZZahleinheit mit einem Eingang, einem Ausgang und einem Steuereingang, urn Daten zu 
speichern, wobei der Eingang der Abspeicher-/Zahleinheit mit dem Ausgang des Schalters verbunden ist, 
der Steuereingang der Abspeicher-/ZahlIogik verbunden ist, urn Steuersignale zu empfangen; und 20 
eine Adressen-Operationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, urn 
Adressenberechnungen durchzufGhren, wobei der Eingang der Adressen-Operationsschaltung mit dem 
Ausgang der Abspeicher-TZahleinheit verbunden ist, der Ausgang der Adressen-Operationsschaltung mit 
dem Ruckfuhr- bzw. Feedbackeingang des Schalters verbunden ist, und der Steuereingang der Adressen- 
Operationseinheit verbunden ist, urn Steuersignale zu empfangen. 25 

15. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 14, bei welcher die Abspeicher- 
/Zahleinheit rekonfigurierbar ist und selektiv als etwas aus der Gruppe konfiguriert werden kann, die ein 
Speicher mit wahlfreiem Zugriff bzw. ein RAM und ein Register aufweist, und zwar in Antwort auf Signal e, 
die an dem Steuereingang der Abspeicher-ZZahleinheit empfangen werden. 

16. Dynamisch rekonfigurierbare Verarbeitungseinheit nach Anspruch 14, bei welcher die Adressen-Opera- 30 
tionsschaltung als eine aus der Gruppe von einem Register und einem Register und einer arithmetischen 
Einheit rekonfigurierbar ist, und zwar in Antwort auf Signale, die bei dem Steuereingang der Adressen- 
Operationsschaltung empfangen werden. 

1 7. System zur dynamisch rekonfigurierbaren Steuerung, das folgendes urnfaBt: 

eine erste rekonfigurierbare Verarbeitungseinheit zur Ausffihrung von Programminstruktionen, um Daten 35 
zu verarbeiten, wobei die erste rekonfigurierbare Verarbeitungseinheit einen Eingang, einen Ausgang und 
eine veranderbare interne Hardware-Organisation aufweist, die selektiv wahrend der AusfQhrung einer 
Sequenz von Prograniminstruktionen veranderbar ist; 

eine erste KLommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von der ersten rekonfigurierbaren Verarbeitungseinheit zu 40 
tibertragen, wobei der Eingang der ersten Kommunikationsvorrichtung mit dem Ausgang der ersten 
rekonfigurierbaren Verarbeitungseinheit verbunden ist, und der Ausgang der ersten Kommunikationsvor- 
richtung mit dem Eingang der ersten rekonfigurierbaren Verarbeitungseinheit verbunden ist 

18. System nach Anspruch 17, das weiter folgendes urnfaBt: 

eine zweite rekonfigurierbare Verarbeitungseinheit zur Ausfuhrung von Prograniniinstruktionen, um Da- 45 
ten zu verarbeiten, wobei die zweite rekonfigurierbare Verarbeitungseinheit einen Eingang, einen Ausgang 
und eine veranderbare interne Hardware-Organisation urnfaBt, die selektiv wahrend der Ausfuhrung einer 
Sequenz von Prograniniinstruktionen veranderbar ist; 

eine zweite Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von der zweiten rekonfigurierbaren Verarbeitungseinheit zu so 
Gbertragen, wobei der Eingang der zweiten Kommunikationsvorrichtung mit dem Ausgang der zweiten 
rekonfigurierbaren Verarbeitungseinheit verbunden ist, und der Ausgang der zweiten Kommunikations- 
vorrichtung mit dem Eingang der zweiten rekonfigurierbaren Verarbeitungseinheit verbunden ist; und 
eine Verbindungseinrichtung zum Leiten von Daten und mit einer Vielzahl von Kommunikationskanalen, 
wobei sowohl der erste Datenport der ersten Kommunikationsvorrichtung als auch der zweite Datenport 55 
der ersten Kommunikationsvorrichtung und der erste Datenport der zweiten Kommunikationsvorrichtung 
und der zweite Datenport der zweiten Kommunikationsvorrichtung mit einem der Vielzahl von Kommuni- 
kationskanalen verbunden ist 

19. System nach Anspruch 18, bei welchem die erste rekonfigurierbare Verarijeitungseinheit dynamisch 
unabh&ngig von der Rekonfiguration der zweiten rekonfigurierbaren Verarbeitungseinheit rekonfigurier- 60 
bar ist 

20. System Anspruch 18, das weiter folgendes aufweist: 

eine dritte rekonfigurierbare Verarbeitungseinheit zur Ausfuhrung von Prograraminstrukttonen, um Daten 
zu verarbeiten, wobei die dritte rekonfigurierbare Verarbeitungseinheit einen Eingang, einen Ausgang und 
eine veranderbare interne Hardware-Organisation aufweist, die selektiv wahrend der Ausfuhrung einer 65 
Sequenz von Programminstruktionen veranderbar ist; und 

eine dritte Konamunikationsvorrichtting mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, um Daten zu und von der dritten rekonfigurierbaren Verarbeitungseinheit zu 
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ubertragen, wobei der Eingang der dritten Konimunikationsvorrichtung mit dem Ausgang der dritten 
rekonfigurierbaren Verarbeitungseinfaeit verbunden ist, der Ausgang der dritten Kommunikationsvorrich- 
tung mit dem Eingang der dritten rekonfigurierbaren Verarbeitungseinheit verbunden ist, sowohl der erste 
Datenport der dritten Kommunikationsvorrichtung als auch der zweite Datenport der dritten Kommunika- 
tionsvorrichtung mit einer der Vielzahl von Kommunikationskanalen der Verbindungseinrichtung verbun- 
den ist. 

21. System nach Anspruch 1 7, das weiter folgendesaufweist: 

eine nicht-rekonfigurierbare Verarbeitungseinheit mit einer vorbestimmten Architektur, urn ein Programm 
von Instruktionen auszufuhren, das a us einem einzigen Instruktionssatz ausgebildet ist, wobei die nicht-re- 
konfigurierbare Verarbeitungseinheit einen Eingang und einen Ausgang umfafit; und 
eine zweite Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zwehen Datenport, urn Daten zu und von der nicht-rekonfigurierbaren Verarbeitungseinheit zu 
ubertragen, wobei der Eingang der dritten Kommunikationsvorrichtung mit dem Ausgang der nicht-rekon- 
figurierbaren Verarbeitungseinheit verbunden ist, der Ausgang der dritten Koramunikationsvorrichtung 
mit dem Eingang der nicht-rekonfigurierbaren Verarbeitungseinheit verbunden ist; und 
eine Verbindungseinrichtung zum Letten von Daten mit einer Vielzahl von Konununikationskanalen, wobei 
sowohl der erste Datenport der ersten Kommunikationsvorrichtung als auch der zweite Datenport der 
ersten Kommunikationsvorrichtung und der erste Datenport der zweiten Kommunikationsvorrichtung und 
der zweite Datenport der zweiten Kommunikationsvorrichtung mit einem der Vielzahl von Kommunika- 
tionskanalen verbunden ist. 

22. System nach Anspruch 17, das weiter folgendes aufweist: 
eine I/O- Vorrichtung mit einem Eingang und einem Ausgang; und 

eine I/O- Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, urn Daten zu und von der I/O-Vorrichtung zu ubertragen, wobei der Eingang der 
I/O-Kornmunikationsvorrichtung mit dem Ausgang der I/O-Vorrichtung verbunden ist, der Ausgang der 
I/O-Kornmunikationsvorrichtung mit dem Eingang der I/O-Vorrichtung verbunden ist; und 
eine Verbindungseinrichtung zum Leiten von Daten mit einer Vielzahl von Kommunikationskanalen, wobei 
sowohl der erste Datenport der ersten Kommunikationsvorrichtung als auch der zweite Datenport der 
ersten Kommunikationsvorrichtung und der erste Datenport der I/O- Kommunikationsvorrichtung und der 
zweite Datenport der I/O-Kommunikationsvorrichtung mit einem der Vielzahl von Kommunikationskana- 
len verbunden ist 

23. System nach Anspruch 17, das weiter eine Master-Zeitbasiseinheit mit einem Ausgang umfafit, um ein 
Master-Zeitsteuersignal zu der ersten rekonfigurierbaren Verarbeitungseinheit zu liefern. 

24. System nach Anspruch 23, bei welchem die erste rekonfigurierbare Verarbeitungseinheit weiter eine 
tokale Zeitbasis-Einheit mit einem Eingang und einem Ausgang umfafit um ein lokales Zeitsteuersignal von 
dem Master-Zeitsteuersignal zu erzeugen, wobei der Eingang der lokalen Zeitbasis-Einheit mit dem Aus- 
gang der Master-Zeitbasiseinheit verbunden ist und der Ausgang der lokalen Zeitbasiseinheit mit einem 
Zettsteuereingang der rekonfigurierbaren Verarbeitungseinheit verbunden ist 

25. System nach Anspruch 17, bei welchem die erste rekonfigurierbare Verarbeitungseinheit a us einer 
programmierbaren Logikvorrichtung aufgebaut ist 

26. System nach Anspruch 25, bei welchem die program mierbare Logikvorrichtung ein erstes feldprogram- 
mierbares Gatter-Array ist, das eine Vielzahl von konfigurierbaren Logikblocken, eine Vielzahl von pro- 
grammierbaren I/O-Bldcken und eine Vielzahl von programmierbaren Verbindungsstrukturen und Daten- 
speicher-Systeraelementen enthalt 

27. System nach Anspruch 17, bei welchem das System weiter einen Speicher umfafit, der einen ersten 
Konfigurationsdatensatz speichert der einer ersten Instruktionssatz-Architektur fur einen seriellen Instruk- 
tionsprozessor entspricht, und einem zweiten Konfigurationsdatensatz, der einer zweiten Instruktionssatz- 
Architektur fQr einen paralleien Instruktionsprozessor entspricht, umfafit und bei welchem die erste rekon- 
figurierbare Verarbeitungseinheit selektiv als eine aus der Gruppe von einem seriellen Instruktionsprozes- 
sor und einem paralleien Instruktionsprozessor konfiguriert wird, und zwar in Antwort auf Signal e von dem 
Speicher, wobei die erste rekonfigurierbare Verarbeitungseinheit mit dem Speicher verbunden ist 

2& System nach Anspruch 27, bei welchem die erste rekonfigurierbare Verarbeitungseinheit mit dem 
Speicher Qber eine Vielzahl von Signalleitungen verbunden ist und die erste Anzahl von der Vielzahl von 
Signalleitungen Adressenleitungen ausbildet, eine zweite Anzahl von der Vielzahl von SignaUeitungen 
Steuerleitungen ausbildet und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbildet, 
wobei die erste Anzahl, die zweite Anzahl und dritte Anzahl der Vielzahl von Signalleitungen rekonfigurier- 
bar sind und gemafi einem Konfigurationsdatensatz gesetzt bzw. eingestellt werden, der durch die erste 
rekonfigurierbare Verarbeitungseinheit verwendet wird. 

29. System nach Anspruch 17, bei welchem die veranderbare interne Hardware-Organisation der ersten 
rekonfigurierbaren Verarbeitungseinheit eine rekonfigurierbare Instruktionsabrufeinheit mit einem ersten 
Dateneingang, einem ersten Steuerausgang und einem zweiten Steuerausgang umfafit, um Instruktions- 
AusfQhrungsoperationen innerhalb der ersten rekonfigurierbaren Verarbeitungseinheit sequentiell zu ord- 
nen, wobei der Dateneingang mit einem Datenport eines Speichers verbunden ist 

30. System nach Anspruch 28, bei welchem die Instruktionsabrufeinheit einen Architekturbeschreibungs- 
speicher mit einem Ausgang umfafit, wobei der Architekturbeschreibungsspeicher einen Satz von Architek- 
turbeschretbungssignalen einschliefilich eines Interruptantwortsignals speichert, das eine Art und Weise 
spezifiziert in der die erste rekonfigurierbare Verarbeitungseinheit auf ein Interruptsignal antwortet, wenn 
sie konfiguriert ist urn eine Instruktionssatz-Architektur zu realisieren bzw.zu implementieren. 
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31. System aach Anspnich 30, bei welchera die Instruktionsabrufeinheit weiter folgendes umfaBt: 

einen Instru ktio nsz us tandsseque nze r bzw. eine Instruktionszustandsfolgesteuereinheit mit einem Eingang 

und einem Ausgang, tun einen Instniktionsaushihrungszyklus mit einem Instruktionsabnifzustand, einen 

Instruktionsdecodierzustand, 

einen Instruktkjnsausfuhrungszustand und einen Schreib-zurOck-Zustand zu steuem, wobei der Instruk- s 
donsausfQhrungszyklus zu der Ausfuhrung einer Instrukdon innerhalb der Instruktionssatz-Architektur 
fQhrt;und 

eine Intemiptszustandsmaschine mit einem Eingang und einem Ausgang, urn ein Obergangssteuersignal zu 
erzeugen, das einen Zustand innerhalb des Instruktionsausfuhrungszyklus spezifiziert, fur den ein Obergang 
zu einem Interruptservicezustand eriaubt ist wobei der Eingang der Interruptzustandsmaschine mit dem to 
Ausgang des Arcbitekturbeschreibungsspeichers verbunden ist, der Ausgang der Interniptzustandsmaschi- 
ne mit dem Eingang des Instrukdonszustandssequeozers bzw. der Instruktionszustandsfolgesteuereinheit 
verbunden ist 

3Z System nach Anspnich 31, bei welchem die Instruktionsabrufeinheit weiter folgendes aufweist: 
eine programmierbare Abrufsteuereinheit mit einem Eingang und einem Ausgang, urn die Operation eines 15 
Instruktionspuffers variabler GroSe zu steuem, wobei der Eingang der programmierbaren Abrufsteuerein- 
heit mit einem Ausgang der Instruktionszustandsfolgesteuereinheit bzw. des Instniktionszustandssequen- 
zers verbunden ist urn Signale zu empfangen, die die Operation der programmierbaren Abrufsteuereinheit 
festlegen, wobei der Eingang der programmierbaren Abrufsteuereinheit mit dem Instruktionspuffer ver- 
bunden ist; und 20 
eine programmierbare Deoodiersteuereinheit mit einem Eingang und einem Ausgang, urn die Operation 
eines Instruktionsdecoders variabler GroBe zu steuem, wobei der Eingang der programmierbaren Abruf- 
steuereinheit mit dem Ausgang des Instruktionszustandssequenzers bzw. der uistruktionszustandsfolge- 
steuereinheit verbunden ist, um Signale zu empfangen, die die Operation der programmierbaren Decodier- 
steuereinheit festlegen, wobei der Ausgang der programmierbaren Deoodiersteuereinheit mit dem Instruk- 25 
tiondecoder verbunden ist und der Instruktionsdecoder verbunden ist um Programminstruktionen von dem 
Instruktionspuffer zu empfangen. 

33. System nach Anspruch 17, bei welchem die veranderbare interne Hardware-Organisation der ersten 
rekonfigurierbaren Verarbeitungseinheit eine rekonfigurierbare Datenoperationseinheit mit einem Daten- 
port und einem Steuereingang umfa£t um Operationen bezuglich Daten durchzufuhren, wobei der Daten- . 30 
port der Datenoperationseinheit mit einem Datenport eines Speichers verbunden ist und der Steuereingang 
verbunden ist, um Steuersignale zu empfangen. 

34. System nach Anspruch 33, bei welchem die rekonfigurierbare Datenoperationseinheit folgendes auf- 
weist: 

einen Schalter mit einem Datenport einem Steuereingang, einem RQckfuhr- bzw. Feedbackeingang und 35 
einem Ausgang, um selektiv Daten zwischen dem Datenport dem RQckfuhr- bzw. Feedbackeingang und 
dem Ausgang zu leiten, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist 
und der Steuereingang des Schalters mit dem ersten Steuerausgang der Instruktionsabrufeinheit verbunden 
ist; 

eine Abspeicher-ZAusrichteinheit mit einem Eingang, einem Ausgang und einer Steuereinheit um Daten 40 
und Datenberechnungsergebnisse zu speichern, wobei der Eingang der Abspeicher-ZAusrichteinheit mit 
dem Ausgang des Schalters verbunden ist der Steuereingang der Speicher-ZAusrichteinheit mit dem ersten 
Steuerausgang der Instruktionsabrufeinheit verbunden ist; und 

eine Datenoperationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, um Datenbe- 
rechnungen durchzufOhren, wobei der Eingang der Datenoperationsschaltung mit dem Ausgang der Ab- 45 
spetcherVAusrichteinheit verbunden ist der Ausgang der Datenoperationsschaltung mit dem Ruckfuhr- 
bzw. Feedbackeingang des Schalters verbunden ist und der Steuereingang der Datenoperationsschaltung 
mit dem ersten Steuerausgang der Instruktionsabrufeinheit verbunden ist 

35. System nach Anspruch 34, bei welchem die Speicher-ZAusrichteinheit als etwas von der Gruppe rekonfi- 
gurierbar ist die einen Speicher mit wahlfreiem Zugriff bzw. ein RAM aufweist und ein gepipelinetes 50 
Register bzw. ein FlicBbandregister aufweist und zwar in Antwort auf Steuersignale von dem Speicher, die 
ein Konfigurationsdatensatz darstellen, der einer ersten Instruktionssatz-Architektur bzw. einer zweiten 
Instruktionssatz-Architektur entspricht 

36. System nach Anspruch 35, bei welchem die Datenoperationseinheit als eine a us der Gruppe von einer 
arithmetischen Logikeinheit und einer gepipelineten Funktionseinheit rekonfigurierbar ist und zwar in 55 
Antwort auf Konfigurationssignale aus dem Speicher. 

37. System nach Anspruch 17, bei welchem die veranderbare interne Hardware-Organisation der ersten 
rekonfigurierbaren Verarbeitungseinheit eine rekonfigurierbare Adressenoperationseinheit mit einem er- 
sten Steuereingang, einem Adresseneingang und einem Ausgang umfaBt um Operationen bezuglich Adres- 
sen durchzufOhren, wobei der Adresseneingang mit dem Datenport eines Speichers verbunden ist und der ao 
Ausgang der Adressenoperationseinheit mit einem Adresseneingang des Speichers verbunden ist und der 
Steuereingang der Adressenoperationseinheit verbunden ist um Steuersignale zu empfangen. 

38. System nach Anspruch 37, bei welchem die rekonfigurierbare Adressenoperationseinheit folgendes 
umfaBt: 

einen Schalter mit einem Datenport einem Steuereingang, einem RQckfuhr- bzw. Feedbackeingang und 65 
etnera Ausgang, um selektiv Adressen zwischen dem Datenport dem Ruckfuhr- bzw. Feedbackeingang und 
dem Ausgang zu leiten, wobei der Datenport des Schalters mit dem Datenport des Speichers verbunden ist 
und der Steuereingang des Schalters mit dem ersten Steuerausgang der Instruktionsabrufeinheit verbunden 
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ist; 

eine Abspeicher-ZZahleinheit mit einem Eingang, einem Ausgang und einem Steuereingang, urn Daten zu 
speichern, wobei der Eingang der Abspeicher-ZZahleinheit mit dera Ausgang des Schalters verbunden ist, 
der Steuereingang der Abspeicher-ZZaMogik mit dena zweiten Steueraus gang der Instruktionsabrufeinheit 
verbunden ist; und 

eine Adressenoperationsschaltung mit einem Eingang, einem Ausgang und einem Steuereingang, urn Adres- 
senberechnungen durchzufuhren, wobei der Eingang der Adressenoperationsschaltung mit dem Ausgang 
der Abspeicher-ZZahleinheit verbunden ist, der Ausgang der Adressenoperationsschaltung mit dem RGck- 
fuhr- bzw. Feedbackeingang des Schalters verbunden ist, und der Steuereingang der Adressenoperations- 
einheit mit dem zweiten Steuerausgang der Instruktionsabrufeinheit verbunden ist 

39. System nach Anspruch 38, bei welchem die Abspeicher-ZZahleinheit rekonfigurierbar ist und selektiv als 
eine aus der Gruppe von einem Speicher mit wahlfreiem Zugriff bzw. einem RAM und einem Register 
konfiguriert werden kann, und zwar in Antwort auf Signale, die am Steuereingang der Abspeicher- ZZahl- 
einheit empfangen werden. 

40. System nach Anspruch 38, bei welchem die Adressenoperationsschaltung als eine aus der Gruppe von 
einem Register und einem Register und einer arithmetischen Einheit rekonfigurierbar ist, und zwar in 
Antwort auf Signale, die an dem Steuereingang der Adressenoperationsschaltung empfangen werden. 

41. System nach Anspruch 17, bei welchem die erste rekonfigurierbare Verarbeitungseinheit folgendes 
umfafit: 

eine rekonfigurierbare Instruktionsabrufeinheit mit einem Dateneingang, einem erstea Steuereingang und 
einem zweiten Steuerausgang, urn Instruktionsausruhrungsoperationen innerhalb der ersten rekonfigurier- 
baren Verarbeitungseinheit sequendell zu ordnen, wobei der Dateneingang mit dem Datenport eines 
Speichers verbunden ist; 

eine rekonfigurierbare Datenoperationseinheit mit einem Datenport und einem Steuereingang, urn Opera- 
tionen bezQglich Daten durchzufuhren, wobei der Datenport der Datenoperationseinheit mit dem Daten- 
port des Speichers verbunden ist und der Steuereingang mit dem ersten Steuerausgang der Instruktionsab- 
rufeinheit verbunden ist ; und 

eine rekonfigurierbare Adressenoperationseinheit mit einem Steuereingang, einem Adresseneingang und 
einem Ausgang, urn Opera tionen bezQglich Adressen durchzufuhren, wobei der Steuereingang der Adres- 
senoperationseinheit mit dem zweiten Steuerausgang der Instruktionsabrufeinheit verbunden ist, der 
Adressenetngang mit dem Datenport des Speichers verbunden ist und der Ausgang der Adressenopera- 
tionseinheit mit einem Adresseneingang des Speichers verbunden ist 

42. System nach Anspruch 41, bei welchem die rekonfigurierbare Instruktionsabrufeinheit, die rekonfigu- 
rierbare Datenoperationseinheit und die rekonfigurierbare Adressenoperationseinheit wahrend der 
Ausftthrung eines Befehis durch die erste rekonfigurierbare Verarbeitungseinheit rekonfigurierbar sein 
kann, 

43. System zum Koppein bzw. Verbinden eines ersten Prozessors bzw. einer ersten Verarbeitungseinrich- 
tung mit einem zweiten Prozessor bzw. einer zweiten Verarbeitungseinrichtung, wobei das System folgen- 
des umfaBt: 

etne erste Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, urn Daten zu und von dem ersten Prozessor zu Obertragen, wobei der Eingang 
und der Ausgang der ersten Kommunikationsvorrichtung mit dem ersten Prozessor verbunden ist; und 
eine zweite Kommunikationsvorrichtung mit einem Eingang, einem Ausgang, einem ersten Datenport und 
einem zweiten Datenport, urn Daten zu und von dem zweiten Prozessor zu Qbertragen, wobei der Eingang 
und der Ausgang der zweiten Kommunikationsvorrichtung mh dem zweiten Prozessor verbunden ist; und 
eine Verbindungseinrichtung zum Bereitstellen einer Punkt-zu-Punkt-Parall-Datenwegeleitung mit einem 
ersten und einem zweiten Kommunikationskanal, wobei der erste Datenport der ersten Kommunikations- 
vorrichtung und der erste Datenport der zweiten Kommunikationsvorrichtung mit dem ersten Kommuni- 
kationskanal verbunden ist und der zweite Datenport der ersten Kommunikationsvorrichtung und der 
zweite Datenport der zweiten Kommunikationsvorrichtung mit dem zweiten Kommunikationskanal ver- 
bunden ist 

44. System nach Anspruch 43, bei welchem die erste und die zweite Kommunikationsvorrichtung jeweils als 
ein feldprogrammierbares Gatter-Array aufgebaut bzw. konstruiert sind. 

45. System nach Anspruch 43, bei welchem die erste Kommunikationsvorrichtung weiter folgendes auf- 
weist: 

eine Schnittsteilen- und Steuereinheit mit einem ersten Datenport, einem zweiten Datenport und einem 
Steuerport, urn Daten und Befehle bzw. Kommandos zu empfangen und zu senden, und zwar zu und von 
dem ersten Prozessor, wobei der erste Datenport mit dem ersten Prozessor zum Senden und Empfangen 
von Daten verbunden ist und der Steuerport mit dem ersten Prozessor zum Senden und Empfangen von 
Befehlen bzw. Kommandos verbunden ist; 

eine erste Verbindungseinheit mit einem Eingang, einem Ausgang, einem Port und einer einzigen Verbin- 
dungsadresse, wobei der Port der ersten Verbindungseinheit mit dem zweiten Datenport der Schnittsteilen- 
und Steuereinheit verbunden ist, und der Eingang und Ausgang der ersten Verbindungseinheit mit Knoten 
des ersten Kommunikationskanals verbunden sind; und 

eine zweite Verbindungseinheit mit einem Eingang, einem Ausgang, einem Port und einer einzigen Verbin- 
dungsadresse, wobei die zweite Verbindungseinheit mit dem zweiten Datenport der Schnittsteilen- und 
Steuereinheit verbunden ist und der Eingang und der Ausgang der zweiten Verbindungseinheit mit Knoten 
des zweiten Kommunikationskanals verbunden sind. 
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46. System nach Anspruch 45, bei welchem die erste Verbindungseinheh folgendes aufweist: 
einen Adressendecoder tan einera Eingang und einera ersten und zwehen Ausgang, urn selektiv Daten zu 
einera der ersten und zweiten Ausgange zu leiten, und zwar in Antwort auf eine Adresse, die als ein TeiJ 
eines Nachrtcbtenpakets ausgebiJdet ist, wobei der Eingang des Adressendecoders mit dera ersten Komrau- 
nikationskanal verbunden ist; 5 
einen ersten Puffer zum Speichern von Daten, wobei der erste Puffer einen Eingang und einen Ausgang 
aufweist, wobei der Eingang des ersten Puffers mit dem ersten Ausgang des Adressendecoders verbunden 
ist und der Ausgang mit dem Interface und der Steuereinheit verbunden ist; 

einen zweiten Puffer zum Speichern von Daten, wobei der zweite Puffer einen Eingang und einen Ausgang 
aufweist, wobei der Eingang des zweiten Puffers mit dem zweiten Ausgang des Adressendecoders verbun- io 
den ist; 

einen dritten Puffer zum Speichern von Daten, wobei der dritte Puffer einen Eingang und einen Aus- 
gang aufweist, wobei der Eingang des dritten Puffers mit der Schnittstellen- und Steuereinheit verbunden 
ist; 

einen Multiplexer mit einera ersten Eingang, einem zweiten Eingang, einem Steuereingang und einera is 
Ausgang, um selektiv Daten von dem ersten Eingang oder dem zweiten Fingang in Antwort auf ein 
Steuersignal zu dem Steuereingang weiterzugeben, wobei der erste Eingang mit dem Ausgang des zweiten 
Puffers verbunden ist, der zweite Eingang mit dem dritten Puffer verbunden ist, der Steuereingang mit der 
Schnittstellen- und Steuerlogik verbunden ist und der Ausgang des Multiplexers mit dem ersten Komm ind- 
ications kanal verbunden ist 20 

47. System nach Anspruch 45, bei welchem 

der erste Prozessor mh der Schnittstellen- und Steuereinheit fiber einen Speicher verbunden ist, der eine 
Vielzahl von Signalleitungen aufweist, und wobei eine erste Anzahl der Vielzahl von Signalleitungen 
Adressenleitungen ausbilden, eine zweite Anzahl der Vielzahl von Signalleitungen Steuerleitungen ausbil- 
den und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbilden; und 25 
der erste Prozessor und die Schnittstellen- und Steuereinheit derartig rekonfigurierbar sind, daft die erste 
Anzahl, die zweite Anzahl und die dritte Anzahl der Vielzahl von Signalleitungen gemaB eines Konfigura- 
tionsdatensatzes, der durch den ersten Prozessor und die Schnittstellen- und Steuereinheit genutzt bzw. 
verwendet wird, eingestellt bzw. gesetzt werden kann. 

48. System nach Anspruch 45, bei welchem 30 
der erste Prozessor mit der Schnittstellen- und Steuereinheit fiber einen Speicher, der eine Vielzahl von 
Signalleitungen aufweist, verbunden ist und wobei eine erste Anzahl der Vielzahl von Signalleitungen 
Adressenleitungen ausbilden, eine zweite Anzahl der Vielzahl von Signalleitungen Steuerleitungen ausbil- 
den und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbilden; und 

der erste Prozessor und die Schnittstellen- und Steuereinheit derartig rekonfigurierbar sind, daB die erste 35 
Anzahl, die zweite Anzahl und die dritte Anzahl der Vielzahl von Signalleitungen gemaB eines Konfigura- 
tionsdatensatzes eingestellt werden kdnnen, der durch den ersten Prozessor und die Schnittstellen- und 
Steuereinheit verwendet bzw. genutzt wird. 

49. System nach Anspruch 45, bei welchem 

der erste Prozessor mit der Schnittstellen- und Steuereinheit fiber einen Speicher, der eine Vielzahl von 40 
Signalleitungen aufweist, verbunden ist, und wobei eine erste Anzahl der Vielzahl von Signalleitungen 
Adressenleitungen ausbilden, eine zweite Anzahl der Vielzahl von Signalleitungen Steuerleitungen ausbil- 
den und eine dritte Anzahl der Vielzahl von Signalleitungen Datenleitungen ausbilden; und 
die Schnittstellen- und Steuereinheit derartig rekonfigurierbar ist; daB die erste Anzahl, die zweite Anzahl 
bzw. die dritte Anzahl der Vielzahl von Signalleitungen eingestellt werden kann, um mit einer Anzahl von 45 
Adressen-, Steuer- bzw. Datenleitungen zusammenzupassen, die durch den ersten Prozessor verwendet 
werden, um auf den Speicher zuzugreif en und diesen zu steuern, 

5a System nach Anspruch 45, bei welchem die Schnittstellen- und Steuereinheit eine Nachricht in einen 
Befehl bzw. in ein Kommando und in Daten, die von dera ersten Prozessor verwendet werden kdnnen, 
umwandelt und Kommandos bzw. Befehle und Daten von dem ersten Prozessor in eine Nachricht zur 50 
Obertragung fiber die Verbindungseinrichtung bfindelt bzw. packetiert 

51. Verfahren zur Erzeugung von Instruktionen, die von einem rekonfigurierbaren Computer aus einer 
Vielzahl von Aussagen hohen Niveaus ausffihrbar sind, wobei das Verfahren die folgenden Schritte auf- 
weist: 

eine Vielzahl von Satzen von Regetn zum Obersetzen von Aussagen hohen Niveaus in Instruktionen, die 55 
durch einen rekonfigurierbaren Computer ausffihrbar sind, wird bereitgestellt; 

einer der Vielzahl von Satzen von Regeln wird als der gegenwirtige Satz von Regeln ausgewahlt, der 
verwendet werden soli, um Aussagen hohen Niveaus in Instruktionen zu abersetzen, die durch einen 
rekonfigurierbaren Computer ausffihrbar sind; 

eine Aussage hohen Niveaus wird ausgewahlt; 60 
ob die gewahlte Aussage hohen Niveaus eine Rekonfigurationsanweisung ist, wird bestimmt; 
der gegenwartige Satz von Regeln, der zum Obersetzen von Aussagen hohen Niveaus verwendet werden 
soil, wird in einen Satz von Regeln geandert, der in der Rekonfigurationsanweisung spezifiziert ist, falls die 
gewahlte Aussage hohen Niveaus eine Rekonflgurationsanweisung ist; und 

die gewahlte Aussage hohen Niveaus wird in we nigs tens eine Instruktion fibersetzt, die durch eine rekonfi- 65 
gurierbaren Computer ausffihrbar ist, indem der gegenwartige Satz von Regeln verwendet wird. 
5Z Verfahren nach Anspruch 51, bei welchem jeder der Vielzahl von Satzen von Regeln zum Obersetzung 
von Aussagen hohen Niveaus in Instruktionen, die durch den rekonfigurierbaren Computer ausffihrbar sind. 
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einer unterschiedlichen Instruktionssatz-Architektur entspricht 

53. Verfahrcn nach Anspruch 5 1 , das weiter folgende Schrittc aufweist: 

die itekonfigurationsanweisung wird in eine Rekonfigurationsaussage mittleren Niveaus ubersetzt, falls die 
gewahlte Aussage hohen Niveaus eine Rekonfigurationsanweisung ist; 

die gewahlte Aussage wird in eine Aussage mittleren Niveaus Qbersetzt falls die gewahlte Aussage hohen 
Niveaus nicht eine Rekonfigurationsanweisung ist; 
eine Registerzuweisung wird durchgefuhrt; 

bei welchem der Schritt der Veranderung des gegenwartigen Satzes von Regeln die folgenden Unterschrit- 
te aufweist: 

eine Aussage mittleren Niveaus wird ausgewahlt; 

es wird bestimmt ob die gewahlte Aussage mittleren Niveaus eine Rekonfigurationsaussage mittleren 
Niveaus ist; und 

ein Satz von Regeln wird ausgewahlt, der der Instruktionssatz-Architektur entspricht die durch die Rekon- 
figurationsaussage mittleren Niveaus spezifiziert ist, falls die gewahlte Aussage mittleren Niveaus eine 
Rekonfigurationsaussage mittleren Niveaus ist; und 

bei welchem der Schritt des Obersetzens der gewahlten Aussage hohen Niveaus den Schritt der Erzeugung 
einer Assemblersprachaussage a us der gewahlten Aussage mittleren Niveaus beinhaltet wobei der gewahl- 
te Satz von Regeln verwendet wird, der der Instruktionssatz-Architektur entspricht, die durch die Rekonfi- 
gurationsaussage mittleren Niveaus spezifiziert ist 

54. Dynamisch rekonfigurierbares Computersystem mit einer rekonfigurierbaren Verarbeitungseinheit, 
wobei ein Verfahren zum dynamisch rekonfigurierbaren Rechnen folgende Schritte aufweist: 

die rekonfigurierbare Verarbeitungseinheit zur Operation gemafi eines ersten Konfigurationsdatensatzes, 
der einer ersten Instruktionssatz-Architektur entspricht, wird konfiguriert, wobei die IConfiguration der 
rekonfigurierbaren Verarbeitungseinheit zu einer Hardware-Organisation fuhrt, die die erste Instruktions- 
satz-Architektur realisiert bzw. implementiert; 

ein Instniktionsausfuhrungszyklus der rekonfigurierbaren Verarbeitungseinheit wird unterbrochen; und 
die rekonfigurierbare Verarbeitungseinheit gemaB einem zweiten Konfigurationsdatensatz, der einer zwei- 
ten Instruktionssatz-Architektur entspricht, wird derart rekonfiguriert daB die Hardware-Organisation der 
rekonfigurierbaren Verarbeitungseinheit die zweite Instruktionssatz-Architektur realisiert 

55. Verfahren nach Anspruch 54, das weiter den Schritt aufweist, wonach wahrend der AusfQhrung einer 
Sequenz von Programminstruktionen bestimmt wird, ob Hardware innerhalb der dynamisch. rekonfigurier- 
baren Verarbeitungseinheit rekonfiguriert werden soil 

56. Verfahren nach Anspruch 55, das weiter den Schritt beinhaltet, wonach ein neuer Instruktionsausfuh- 
rungszyklus nach dem Schritt einer Rekonfigurierung ausgelost wird. 

57. Verfahren nach Anspruch 56, bei welchem der Instruktionsausfuhrungszyklus einer ersten Programmin- 
struktion innerhalb der Sequenz von Programminstruktionen entspricht, und der neue Instruktionsausfuh- 
rungszyklus einer zweiten Programminstruktion innerhalb der Sequenz von Prograniminstruktionen ent- 
spricht 

58. Verfahren nach Anspruch 54, das weiter die folgenden Schritte aufweist: 

ein erster Satz von Obergangssteuersignalen, der der ersten instruktionssatz-Architektur entspricht, wird 
erzeugt wobei der erste Satz von Obergangssteuersignalen einen Satz unterbrechbarer Zustande innerhalb 
des Instruktionsausfuhrungszyklus spezifiziert; und 

ein zweiter Satz von Obergangssteuersignalen wird erzeugt der der zweiten Instruktionssatz-Architektur 
entspricht wobei der zweite Satz von Obergangssteuersignalen einen Satz unterbrechbarer Zustande 
innerhalb eines zweiten Instniktionsau^uJuiingszyklus spezifiziert 

59. Dynamisch rekonfigurierbarer Computer, der folgendes aufweist: 

eine Einrichtung zum Konfigurieren einer rekonfigurierbaren Verarbeitungseinheit mit einem ersten Konfi- 
gurationsdatensatz, der einer ersten Instruktionssatz-Architektur entspricht wobei die {Configuration der 
rekonfigurierbaren Verarbeitungseinheit zu einer Hardware-Organisation fuhrt, die die erste Instruktions- 
satz-Architektur realisiert bzw. implementiert; 

eine Einrichtung, urn wahrend der AusfQhrung einer Sequenz von Programminstruktionen zu bestimmen, 
ob die rekonfigurierbare Verarbeitungseinheit rekonfiguriert werden soli; und 

eine Einrichtung zum Rekonfigurieren der rekonfigurierbaren Verarbeitungseinheit gemaB eines zweiten 
Konfigurarionsdatensatzes derart daB die rekonfigurierbare Verarbeitungseinheit eine neue Hardware-Or- 
ganisation aufweist die eine zweite Instruktionssatz-Architektur realisiert bzw. implementiert 

60. Computer nach Anspruch 59, der weiter folgendes aufweist: 

eine Einrichtung, urn einen ersten Instnikdonsausfuhrungszykius, der einer ersten Programminstruktion 
innerhalb einer Sequenz von Programminstruktionen entspricht fur den Fall zu unterbrechen, daB die 
rekonfigurierbare Verarbeitungseinheit rekonfiguriert werden soli; und 

eine Einrichtung, urn einen zweiten Instniktionsausfuhrungszyklus auszuldsen, der einer zweiten Pro- 
grarnminstruktion innerhalb der Sequenz von Prograniminstruktionen entspricht und zwar nachdem die 
rekonfigurierbare Verarbeitungseinheit rekonfiguriert worden ist 

61. Computer nach Anspruch 59, der weiter eine Einrichtung zur Erzeugung eines Satzes von Obergangs- 
steuersignalen erzeugt die einer Instrukuonssatz-Architektur entsprechen, wobei der Satz von Obergangs- 
steuersignalen einen Satz von unterbrechbaren Zustanden innerhalb eines Instniktionsausfuhrungszyklus 
spezifiziert 

62. Dynamisch rekonfigurierbarer Computer innerhalb einer reprogrammierbaren Logikvorrichtung bzw. 
innerhalb eines reprogrammierbaren Logikbauelements, wobei der dynamisch rekonfigurierbare Compu- 
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terfofgendes aufweist: 

einen Architekturbeschreibungsspeicher mit cinem Ausgang, um Archi tekturb eschre ib ungss i gn a! e zu spei- 
chern, die eine Architektur des rekonfigurierbaren Computers charakterisieren, wobei die Architekturbe- 
schreibungssignale ein Interruptantwort signal umfassen, das eine Art und Weise spezifiziert, in der der 
dynamisch rekonfigurierbare Computer auf einen Interrupt antwortet; s 
einen Instrukttonszustandssequenzer bzw. eine Iostruktionszustandsfolgesteuereinheit mit einera Eingang, 
um eine AusfOhrung einer Instruktion durch den rekonfigurierbaren Computer zu steuern; und 
eine Interruptzustandsmaschine mit einem ersten Eingang, einera zweiten Eingang und einem Ausgang; um 
ein Obergangssteuersignal zu erzeugen, das spezifiziert bzw. vorgibt, wenn wahrend des Instruktionsaus- 
fuhrungszyklus ein Obergang zu einem Interruptservicezustand erlaubt ist, wobei der Eingang der Inter- to 
ruptzustandsmascriine mit dem Ausgang des Architekturbeschreibungsspeichers verbunden ist und der 
Ausgang der Interruptzustandsmaschine mit dem Eingang des Instruktionszustandssequenzers bzw. der 
Instrukdonszustandsfolgesteuereinheit verbunden ist 

63. Computer nach Anspruch 62, bei welchem 

ein erster Abschnitt der rekonfigurierbaren Logikvorrichtung gemaB einem ersten Satz von Konfigura- is 
tionsdaten konfiguriert ist, und zwar derart, daB eine erste Instruktionssatz-Architektur in dem ersten 
Abschnitt ausgebiidet wird; 

ein zweiter Abschnitt der rekonfigurierbaren Logikvorrichtung gemaB einem zweiten Satz von Konfigura- 
tionsdaten derart konfiguriert wird, und zwar derart, daB eine zweite Instruktionssatz-Architektur in dem 
zweiten Abschnitt ausgebiidet wird; 20 
der rekonfigurierbare Computer konfiguriert werden kann, um den ersten Abschnitt oder den zweiten 
Abschnitt zur Verarbeitung zu verwenden; und 

die Interruptzustandsmaschine in den Obergangssteuersignalen eine Anzeige des Abschnittes der repro- 
grammierbaren Logikvorrichtungen bzw. einen Hinweis auf den Abschnitt, auf den der rekonfigurierbare 
Computer zurn Verwenden bzw. zum Gebrauch eingestellt bzw. gesetzt ist, und die Instruktionen, die durch 25 
die ausgewahlte Instruktionssatz-Architektur ausgefuhrt werden konnen, beinhaltet 

64. Verfahren zum Verarbeiten von Daten mit einem dynamisch rekonfigurierbaren Computer, der einen 
Instriiktionsarafuhrungszyklus bereitstellt, der einen Instruktkmsabrufzustand, einen Instruktionsdecodier- 
zustand, einen Instruktiomausfuhrungszustand und einen Schreib-zurQck-Zustand umfaBt, wobei das Ver- 
fahren folgende Schritte aufweist: 30 
der Computer wird zum Betrieb gemaB einer ersten Instruktionssatz-Architektur konfiguriert, die unter- 
brechbare bzw. auf ein Interrupt ansprechende Zustande spezifiziert bzw. vorgibt; 

ein Interruptsignal wird empfangen; 

ein Betriebszustand bzw. Operationszustand fur den dynamischen rekonfigurierbaren Computer wird 
bestimmt; 35 
es wird bestimmt, ob der Betriebszustand bzw. Operadonszustand des dynamisch rekonfigurierbaren 
Computers unterbrechbar ist; 

das Interruptsignal wird abgearbeitet, falls der dynamisch rekonfigurierbare Computer bestimmt ist, in 
einem unterbrechbaren Zustand zu sein. 

65. Verfahren nach Anspruch 64, das weiter die folgenden Schritte aufweist: 40 
ein nachster unterbrechbarer Zustand wird bestimmt; indem der Betrieb bzw. die Operation des dynamisch 
rekonfigurierbaren Computers unterbrechbar sein kann, falls der dynamisch rekonfigurierbare Computer 
sich nicht in einem unterbrechbaren Zustand befindet; 

es wird bestimmt, wenn der dynamisch rekonfigurierbare Computer in den nachsten unterbrechbaren 
Zustand ubergeht, falls der dynamisch rekonfigurierbare Computer sich nicht in einem unterbrechbaren 45 
Zustand befindet; 

das Interruptsignal in dem nachsten unterbrechbaren Zustand wird abgearbeitet bzw. bedient, falls be- 
stimmt ist, daB der dynamisch rekonfigurierbare Computer nicht in einem unterbrechbaren Zustand ist 

66. Verfahren nach Anspruch 64, bei welchem der Schritt des Bedienens bzw. Abarbeitens des Interruptsig- 
nals weiter folgende Schritte aufweist: 50 
ein Ursprung bzw. Anfang, eine Prioritat und eine Interrupthandleradresse bzw. eine Adresse der Inter- 
rupthandhabungseinrichtung wird fur den Interrupt bestimmt; 

es wird bestimmt ob das Interruptsignal eine Rekonfiguration anzeigt; und 

Konfigurationsdaten fur eine neue Instruktionssatz-Architektur werden im Interruptsteuerregister gespei- 
chert, falls das Interruptsignal Rekonfiguration anzeigt. 55 

67. Verfahren nach Anspruch 64, bei welchem der Schritt, wo nach bestimmt wird, ob der Betriebszustand 
bzw. Operationszustand des dynamisch rekonfigurierbaren Computers unterbrechbar ist,weiter folgende 
Schritte aufweist: 

ein Obergangssteuersignal wird empfangen, das der Instrukdonssatz-Architektur entspricht, fur die der 
dynamisch rekonfigurierbare Computer konfiguriert worden ist, wobei die Obergangssteuersignale wenig- 60 
stens einen Zustand spezifizieren, in dem die AusfOhrung von Instruktionen unterbrechbar ist; und 
die Zustande, die durch die Obergangssteuersignale spezifiziert sind, werden mit dem Betriebszustand bzw. 
Operationszustand des dynamisch rekonfigurierbaren Computers verglichen. 

68. Verfahren nach Anspruch 64, bei welchem der dynamisch rekonfigurierbare Computer gemaB einer 
Anzahl von verschiedenen InstnucUonssatz-Architekturen konfiguriert werden kann, wobei jeder der In- 65 
struktionssatz-Architekturen ein Satz von Obergangssteuersignalen liefert, die wenigstens einen unter- 
brechbaren Betriebszustand einer Instruktionsausfilhrung festlegeru 

69. Verfahren nach Anspruch 68, bei welchem jede Instruktionssatz-Architektur einen rekonfigurierbaren 
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Interruptmechanismus umfaBt, der durch Modifikation des Satzes von Obergangssteuersignalen bereitge- 
steQt wird, die der Instruktionssatz-Architektur zugeordnet sind. 
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